Загрузка данных в системе r

13
Тема 3 Сергей Мастицкий БГУ, Минск, май 2014

Upload: sergey-mastitsky

Post on 05-Dec-2014

451 views

Category:

Data & Analytics


10 download

DESCRIPTION

Приведен пример загрузки данных в рабочую среду системы статистических вычислений R.

TRANSCRIPT

Page 1: Загрузка данных в системе R

Тема 3

Сергей Мастицкий БГУ, Минск, май 2014

Page 2: Загрузка данных в системе R

3.1. Использование Excel для подготовки данных

Page 3: Загрузка данных в системе R

Microsoft Excel – одна из наиболее

распространенных программ для подготовки

данных для R

Перед загрузкой в R, Excel-файл обычно сохраняют как текстовый файл.txt or .csv

Имеется возможность работать и с др.

форматами (SPSS, SAS, Access, SQL, и др.) – см. пакет foreign

Author: Sergey Mastitsky

Page 4: Загрузка данных в системе R

Никаких пустых ячеек – отсутствующие значения обозначаются как NA

Присвойте имя каждой

переменной:

Никаких пробелов в именах

Имена не должны начинаться с точек или

чисел

Файл стоит поместить в текущую рабочую

папку

Author: Sergey Mastitsky

Page 5: Загрузка данных в системе R

Эксперимент по влиянию pH на рост

Dreissena polymorpha* 4 pH-группы: Control (вода из оз.

Онтарио), A (7.3), B (7.1), and C (6.9)

Три повтора на группу: Control1-

Control3, A1-A3, B1-B3, и C1-C3

Wikipedia Author: Sergey Mastitsky

* Claudi R, Graves A, Taraborelli AC, Prescott RJ, Mastitsky SE (2012)

Impact of pH on survival and settlement of dreissenid mussels. Aquatic

Invasions 7(1): 21-28

Page 6: Загрузка данных в системе R

3.2. Загрузка данных

Подробнее см.:

http://r-analytics.blogspot.de/2011/11/r_08.html

Page 7: Загрузка данных в системе R

Из командной строки: > setwd("~/Introductory R

Course/R_Course_Datasets")

Или в RStudio:

Session -> Set Working Directory -> Choose

Directory -> …

Author: Sergey Mastitsky

Page 8: Загрузка данных в системе R

Откройте файл pH_down_experiment.xls

Ознакомьтесь с данными

Сохраните как файл с разделителем в виде

табуляции

Откройте файл

в текстовом редакторе

и посмотрите, как

он выглядит

Author: Sergey Mastitsky

Page 9: Загрузка данных в системе R

"Рабочая лошадка" для загрузки данных

Основные аргументы: - file = "имя.txt": имя файла (или

URL-ссылка) - header = TRUE: есть ли в файле

заголовки столбцов - sep = "\t" или sep = "," :

разделитель значений в файле

Author: Sergey Mastitsky

Page 10: Загрузка данных в системе R

> LWdata <- read.table(

file = "pH_down_experiment.txt",

header = TRUE,

sep = "\t")

> names(LWdata)

> head(LWdata)

> LWdata

Author: Sergey Mastitsky

Page 11: Загрузка данных в системе R

Author: Sergey Mastitsky

Page 12: Загрузка данных в системе R

Author: Sergey Mastitsky

Page 13: Загрузка данных в системе R

> save.image(file =

"pH_experiment.rda")

Или в RStudio:

Environment -> Save Workspace As… pH_experiment.rda

Author: Sergey Mastitsky