用电子表格进行数据分析
清理、转换和分析原始数据是获得有用的、相关的信息过程中的第一步,这些信息可以帮助企业做出明智的结论。
通过提供相关信息和事实,通常以图表、图片、表格和图形的形式呈现,该策略有助于降低与决策相关的风险。
数据分析涉及到将未经处理的数据转化为相关的统计数据、知识和解释的过程。
数据分析是一种重要的能力,可以支持更好的决策。
电子表格是最经常使用的数据分析工具,而内置的透视表是最受欢迎的分析工具。
电子表格中的数据分析函数
电子表格包括数以百计的函数,因此尝试将正确的公式与其正确的数据分析相匹配可能是很困难的。最重要的函数不一定是最难做的。让我们讨论一些简单的函数,以提高你的数据解释能力。
Concatenate()
数据分析中最容易理解但最有效的公式之一是=CONCATENATE。每一个单元格都可以包含数字、文本、日期,以及来自多个单元格的许多其他信息。
语法
CONCATENATE (string1, string2, [string3], ...)
Len()
LEN()函数用于显示每个单元格中存在的字母总数。它通常是在试图区分产品编号或在我们处理有字符限制的内容时使用。
语法
SYNTAX = LEN (text)
Days()
这个函数 = DAYS 可以用来确定两个日期之间有多少个日历日。
语法
DAYS (from_date(ending date), to_date(starting date))
Networkdays()
网络日属于电子表格中的日期/时间类别。每当这个函数被调用时,周末的计数被隐含地省略了。
networkday功能用于会计和财务。一个简单的用例可以是根据工作天数、解决消费者问题所需的工作天数或项目期间可利用的工作天数来确定员工的福利。
语法
NETWORKDAYS (starting_date, ending_date, [list of holidays])
Sumifs
=SUMIFS()是许多数据分析师使用的 “必须知道 “的数据分析公式之一。
公式=SUM是众所周知的,但如果我们需要根据多个因素对数据进行求和。
我们可以使用SUMIFS()。
语法
SUMIFS (range of sum , range_1, test_1, [range_2], [test_2], ...)
在这里,你可以在test_1,test_2的位置输入不同的标准。
Averageifs()
与SUMIFS类似,AVERAGEIFS()可以让你计算一个基于参数的平均值。这些参数可以是一个或多个。
语法
AVERAGEIFS (average_range, range_1, test_1, [range_2], [test_2], ...)
Countsifs ()
使用电子表格进行数据分析的一个更有效的工具是COUNTIFS()函数。
它很好地模仿了SUMIFS函数。
COUNTIFS()函数记录了有多少个值符合一组特定的标准。
因此,它不需要像SUMIFS中那样的范围。
COUNTIFS (range, criteria)
Counta()
一个单元格的空状态是由COUNTA决定的。
作为一个数据分析员,你会经常遇到不完整的数据集。
你可以使用COUNTA调查数据集中的任何空白,而不必重新排列数据。
语法
COUNTA (value1, [value2], ...)
Vlookup()
Vertical Lookup是缩写VLOOKUP的意思。
该函数指示Spreadsheets在某一列(被称为 “表阵列”)中搜索一个明确的值,以便从同一行中的不同列中检索一个项目。
VLOOKUP (item for lookup, matrix , col_indx_number, [lookup_rng])
Hlookup()
HLOOKUP是指水平查找。每当我们想在表的顶部搜索某一行的数据时,就会用到它。Hlookup也可以在数据库中查找特定数量的行。
HLOOKUP (index for lookup, matrix, row_index_number, [lookup_rng])
If()
IF功能是相当有用的。
在这个功能的帮助下,我们可以自动对电子表格做出决定。
根据逻辑测试的结果,我们可以使用IF()来指示Spreadsheet进行新的计算或显示不同的值。
在IF()函数中,将进行一个测试,结果将被事先反馈给两个结果;即如果测试成功或不成功。
例如,让我们举一个例子,我们想决定一个数字是否是偶数。
这里的逻辑测试将是计算除以2时的数字余数。
如果余数为0,答案为真,否则答案为假。
IF (test, [ans_if_test_successful], [ans_if_test_unsuccessful])
定位/搜索
Spreadsheets的FIND函数给出了一个字符串在另一个字符串(以数字形式出现)中的位置。
如果不能找到文本,FIND命令会返回一个#VALUE错误。
然而,=SEARCH的 “Bigger “将扩大查询的范围,返回Bigger或更大的结果。
如果你在寻找异常情况或特殊身份,这相当有用。
语法
FIND (text to find, string in which you want to search,
[starting_number])
语法
SEARCH (text to find, string in which you want to search,
[starting_number])
左派/右派
从单元格获取静态数据的简单而有效的方法是=LEFT和=RIGHT。
而=LEFT将返回从当前单元格开始的 “x “个字母,=RIGHT将返回从当前单元格结束的 “x “个字母。
LEFT (txt, [num of characters])
RIGHT (txt, [num of characters])
Rank()
尽管是一个过时的电子表格函数,但=RANK对数据分析仍有帮助。使用=RANK函数,一个数据集的值可以按照升序或降序快速排列。在这个例子中,RANK被用来识别下订单最多的客户。
SYNTAX = RANK (number, ref, [order])
Iferror()
通过使用IFERROR,我们可以进行不同的计算,甚至报告一个比Excel更详细的错误。IFERROR函数需要两件事才能发挥作用。什么值需要进行错误验证,以及在其位置上应该做什么。
SYNTAX = IFERROR (value, value_if_error)
结论
电子表格是最经常使用的数据分析工具。在这篇文章中,我们了解了用于数据分析的电子表格的各种功能及其语法和输出。我们希望这篇文章能帮助你提高对电子表格的认识。