Excel 2007 има страхотни инструменти за анализ на данни. Можете да създадете всяка статистика, която искате; просто се уверете, че знаете какво означава статистиката. За това трябва да знаете наличните статистически мерки, булевите изрази, които Excel 2007 използва, и функциите на базата данни на Excel 2007.
Функции на базата данни на Excel 2007
Инструментите за анализ на данни на Excel 2007 включват набор от функции на база данни за извършване на статистически изчисления, използвайки информация от списъци. Следващата таблица показва тези функции и обяснява какво прави всяка:
Функция |
Описание |
ДЕВЕРАЗ |
Изчислява средноаритметично |
DCOUNT |
Отчита броя на клетките със стойности |
DCOUNTA |
Отчита броя на клетките, които не са празни |
DGET |
Връща стойност от списък с база данни |
DMAX |
Намира най-голямата стойност в списък |
DMIN |
Намира най-малката стойност в списък |
DPRODUCT |
Изчислява произведението на критериите за съвпадение на стойностите |
DSTDEV |
Изчислява стандартното отклонение на пробата |
DSTDEVP |
Изчислява стандартното отклонение на популацията |
DSUM |
Изчислява сумата от стойности, отговарящи на критериите |
DVAR |
Изчислява дисперсията на извадка |
DVARP |
Изчислява дисперсията на популация |
Всички тези функции на базата данни използват стандартен синтаксис с три аргумента. Например, функцията DAVERAGE изглежда така: =DAVERAGE(база от данни,поле,критерии), където базата данни е препратка към диапазона към списъка на Excel, който съдържа стойността, която искате да проверите, полето казва на Excel коя колона в базата данни да провери и критерии е препратка към диапазона, която идентифицира полетата и стойностите, използвани за дефиниране на вашите критерии за избор. Аргументът на полето може да бъде препратка към клетка, съдържаща името на полето, името на полето, затворено в кавички, или число, което идентифицира колоната (1 за първата колона, 2 за втората колона и т.н.).
Бърз анализ на данни на Excel 2007 от лентата на състоянието
Excel 2007 може да ви разкаже доста за избран диапазон от клетки само от лентата на състоянието. Когато изберете клетки, които имат данни в тях, лентата на състоянието на Excel може да ви каже полезна информация за тези клетки. Когато щракнете с десния бутон върху лентата на състоянието, Excel показва изскачащо меню, което включва няколко статистически мерки, които можете да направите за избрания диапазон; те са показани в следната таблица:
Опция за статистически мерки |
Какво прави |
Опция за статистически мерки |
Какво прави |
[Нито един] |
Казва на Excel, че не искате той да изчислява и след това да показва
статистика в лентата на състоянието. |
Максимум |
Намира най-голямата стойност в избрания диапазон |
Средно аритметично |
Намира средната стойност на стойностите в избрания диапазон. |
Минимум |
Намира най-малката стойност в избрания диапазон |
Броя |
Изчислява клетките, които съдържат етикети, стойности или формули. Използвайте
това, когато искате да преброите броя на клетките, които не са
празни. |
Сума |
Добавя стойностите в избрания диапазон |
Числово преброяване |
Изчислява броя на клетките в избран диапазон, които съдържат
стойности или формули. |
|
|
Използване на булеви изрази в анализа на данни с Excel 2007
Инструментите за анализ на данни на Excel 2007 включват булеви изрази, разбира се. За да създадете булев израз, като например когато филтрирате критерии, използвайте оператор за сравнение и след това стойност в сравнението (>5, например). Следната таблица показва операторите за сравнение на Excel и какво представляват:
Оператор за сравнение |
Какво означава |
= |
Равно на |
> |
По-голям от |
>= |
По-голямо или равно на |
< |
По-малко от |
<= |
По-малко или равно на |
<> |
Не е равно на |
Статистически условия, които трябва да знаете, когато използвате инструменти за анализ на данни на Excel 2007
С инструментите за анализ на данни, налични в Excel 2007, можете да създавате електронни таблици, които показват подробности за всяка статистика, която можете да създадете формула за намиране — и можете да намерите произволно число. Помага да знаете какво търсите и какво да очаквате, а термините в следващия списък ви помагат да разберете какви видове статистически данни можете да генерирате.
-
средно: Обикновено средната стойност е средноаритметичната стойност за набор от стойности. Excel предоставя няколко средни функции.
-
хи-квадрат: Използвайте хи-квадрати, за да сравните наблюдаваните стойности с очакваните стойности, връщайки нивото на значимост или вероятността (наричана още p-стойност ). p-стойността ви помага да прецените дали разликите между наблюдаваните и очакваните стойности представляват случайност.
-
кръстосано табулиране: Това е техника за анализ, която обобщава данните по два или повече начина. Обобщаването на информация за продажбите както по клиент, така и по продукт е кръстосана таблица.
-
описателна статистика: Описателната статистика просто описва стойностите в набор. Например, ако сумирате набор от стойности, тази сума е описателна статистика. Намирането на най-голямата стойност или най-малката стойност в набор от числа също е описателна статистика.
-
експоненциално изглаждане: Експоненциалното изглаждане изчислява подвижната средна стойност, но претегля стойностите, включени в изчисленията на пълзящата средна стойност, така че по-новите стойности да имат по-голям ефект.
-
статистически данни за изводи : Статистическите данни за изводи се основават на много полезната, интуитивна идея, че ако погледнете извадка от стойности от популация и извадката е достатъчно представителна и голяма, можете да направите заключения за популацията въз основа на характеристиките на извадката.
-
ексцес: Това е мярка за опашките в разпределението на стойностите.
-
медиана: Медианата е средната стойност в набор от стойности. Половината от стойностите падат под медианата, а половината от стойностите падат над медианата.
-
режим: Режимът е най-често срещаната стойност в набор.
-
пълзяща средна: Плъзгащата средна се изчислява, като се използва само определен набор от стойности, като средна стойност, базирана само на последните три стойности.
-
нормално разпределение: Известно също като гаусово разпределение, нормалното разпределение е прословутата крива на камбана.
-
p-стойност: p-стойност е нивото на значимост или вероятност.
-
регресионен анализ: Регресионният анализ включва начертаване на двойки независими и зависими променливи в XY диаграма и след това намиране на линейно или експоненциално уравнение, което най-добре описва нанесените данни.
-
асиметрия: Това е мярка за симетрията на разпределението на стойностите.
-
стандартно отклонение: Стандартното отклонение описва дисперсия относно средната стойност на набора от данни. Можете да мислите за стандартното отклонение като средно отклонение от средната стойност.
-
дисперсия: Дисперсията описва дисперсията на средната стойност на набора от данни. Дисперсията е квадратът на стандартното отклонение; стандартното отклонение е корен квадратен от дисперсията.
-
z-стойност : Това е разстоянието между стойност и средната стойност по отношение на стандартните отклонения.