본문내용 바로가기

KYOBO 교보문고

명강의Big10 이연
초인기 특별전 신작 e캐시
힙터링 기프트카드
  • 한국근대사기행
  • 석강-남재작소장
  • 손글씨스타
  • 석강-남재작소장
  • 스타 4회차
POD

R로 하는 빅데이터분석

진하수 지음 | 부크크(Bookk) | 2022년 03월 11일 출간
  • 정가 : 18,700원
    판매가 : 18,700 [0%↓ 0원 할인]
  • 통합포인트 :
    [기본적립] 560원 적립 [3% 적립] 안내
  • 추가혜택 : 카드/포인트 혜택 안내 도서소득공제 안내 추가혜택 더보기
  • 배송비 : 해당 도서 포함 만원이상 구매시 무료 배송비 안내
  • 예상출고일 : 08월 23일 출고 예정
    양장도서 예상출고일보다 2-3일 추가 기간소요 배송일정 안내

본 상품은 주문 후 제작되는 맞춤도서입니다.
주문 기간에 따라 도서 출고일은 최소 3일에서 최대 8일이 소요됩니다.

취소/반품에 대한 안내(필수)
POD도서는 고객 주문 후 제작되는 도서로, 단순변심 및 착오로 인한 취소, 반품이 절대 불가하니 이점 반드시 유의하여 주시기 바랍니다.

상품상세정보
ISBN 9791137276802
쪽수 216 쪽
크기 182 * 257 mm
  • * POD도서는 도서를 전자파일로 보유하고, 주문 시 책의 형태로 인쇄/제본되는 도서입니다. 디지털 데이터로 제작하므로,
     출판사에서 제작한 일반도서와는 차이가 있을 수 있습니다. (전자 파일은 별도로 제공되지 않습니다)
  • * POD도서는 주문 후 제작이 진행되므로, 실제 배송까지는 시일이 소요됨을 양해부탁드립니다.
  • * POD도서는 판매자가 지정한 형태로 판형과 제본, 칼라와 흑백 등의 인쇄가 이루어집니다.
  • * POD도서의 판매 가격은 제작단가의 조정에 의해 변동될 수 있습니다.
  • * POD도서는 별도의 부록이 제공되지 않습니다.

책소개

R로하는 빅데이터 분석으로 완전 기초에서 머신러닝 응용까지
빅데이터 분석 기사를 준비하는 수험생과 빅데이터 분석을 배우고자 하는 분들에 유용한다.
R 환경에서 빅데이터 시험을 보시는 분들에게 아주 유용한 팁을 담고 있다.
빅데이터 분석 환경상 긴 시간과 지루함을 제거하는데 유용한 기능들이 담겨져 있다.
처음부터 R 언어를 활용하고 응용하고자 하시는 사용자에게 아주 유용한 책이다.

저자소개

저자 : 진하수


한국디지털경제연구원 대표원장, 디지털경제학 박사, 데이터통계처리(stata, spss, sci급, kci급),
python과 R을 활용하는 빅데이터 처리 분석, 머신러닝과 딥러닝의 인공지능 분석 처리와 전문평가위원,
블록체인과 가상화폐 분석처리와 전문심사위원, 스마트팩토리전문위원 등으로
여러대학의 박사/석사 과정의 강사로 활동하고 있다.

목차

제1부 빅데이터와 R 1

1. 빅데이터와 R 1
1.1 빅데이터 소개 1
1.2 R이란 2
1.3. 설치와 유용한 환경 3
1.4. 도움말 기능 4
1.5. 주석처리 5
1.5. 단축키 사용 6
?1.6. IDE 7
1.7. 할당 기호 “=”와 “〈-” 8
1.8. 데이타 제거 10
1.9. plot창 제거 10
1.10. plot의 마진설정 11
1.11. 언어설정 12
1.12. Error in plot.new() 13

2. R Studio_환경 구축과 시작 14
2.1. 경로 지정·확인하기 14
2.2. 패키지 설치·확인 15
2.3. Google Colab에서 패키지 설치 17
2.4. csv file 불러오기 17
2.5. 내장된 data 불러오기 18
2.6. 여러 csv 파일 불러오기 19
2.7. 웹페이지 불러오기 21
?2.8. excel file 22
2.9. 찾아서 불러오기 22
2.10. 파일 리스트 출력 23
2.11. 불러오기 Errors 23
2.12. .csv 저장하기 24
2.13. iris 데이터 엑셀로 저장 24
2.14. 그래프 저장하기 25
2.15. save(), load() 26

3. 데이터 타입 27
?3.1. 변수 27
3.2. 스칼라 28
3.2.1. 숫자 28
3.2.2. NA 29
3.2.3. NULL 29
3.2.4. 일반 연산자 29
3.2.5. 문자열 30
3.2.6. 진리값 31
3.2.7. 요인(Factor) 32
3.2.8. ordered = T 33
3.3. 벡터(Vector) 34
3.3.1. “c( )” 함수 34
3.3.2. 인덱싱과 슬라이싱 35
3.3.3. 벡터 연산 36
3.3.4. 벡터와 행렬 함수 37
3.3.4. seq() 38
3.3.5. rep() 38
3.3.6. 원소 치환(Substitution) 38
3.3.7. 원소의 제거 39
3.4. 리스트(List) 40
3.4.1. 리스트의 정의 40
3.4.2. 리스트내 데이터 접근 41
3.4.3. names() & unlist() 41
3.5. 행렬(matrix) 43
3.5.1. 행렬의 정의 43
3.5.2. 행렬 원소지정(Indexing or Slicing) 45
3.5.3. 행렬의 연산 46
3.5.4. 정방행렬과 ncol(), nrow() 47
3.5.5. col(row)Means(), col(row)Sums() 48
3.5.6. rbind(), cbind() 49
3.5.7. 열과 행의 이름 51
3.5.8. Error in x %*% y 52
3.6. 배열 53
3.6.1. 배열 정의 53
3.6.2. 배열 데이터 접근 54
3.7. 데이터 프레임(Data Frame) 56
3.7.1. 데이터 프레임 정의 56
3.7.2. 데이터 프레임 접근 57
3.7.3. 특수 연산자 %in%, %any% 58
3.7.4. str() head() summary() 59
3.7.5. rownames(), colnames() 60
3.7.6. 연관 검색 61
3.7.7. attach()와 detach() 62
3.8. 타입 판별 64
3.8.1. 타입 변환 65
3.8.2. 자료 구조의 확인과 변환 66

제 2부 함수,제어와 데이터 전처리 69

4. IF, FOR, WHILE 문 69
4.1. IF문 구조 69
4.2. if-else 구문 70
4.3. if-else if-else 구문 70
4.4. ifelse() 함수 71
4.5. For( ) 71
4.6. Break 71
4.7. While( ) 72
4.8. Next 72
4.9. Repeat( ) 73
4.10. NA의 처리 73
4.10.1. 결측치 확인 74
4.10.2. 결측치 대체법 (Imputation) 75
4.10.3. dplyr()로 exam.csv처리 76
4.10.4. na.rm=T 결측치 제외 79
4.10.5. mpg 데이터 조작 81

5. 함수의 정의 83
5.1. 함수 용례 83
5.2. 중첩함수((Nested Function) 84
5.3. 함수의 코드 보기 85
5.4. 스코프(Scope) 85
5.5. 기타 함수sum(), mean() 86

6. 데이타 가공 88
6.1. upSample() 함수 88
6.2. downSample() 89
6.3. scale() 표준화(Standardization) 90
6.2. 범위 정규화 minmax() 92
6.3. 기술통계량 93
6.3.1. sapply() 함수로 평균 93
6.3.2. summary() 94
6.3.3. fivenum() 함수 94
6.3.4. Hmisc 패키지의 describe() 함수 94
6.3.5. pastecs 패키지의 stat.desc() 함수 95

제 3부. 데이터 조작 98

7. 수식 연산 98
7.1. 다항식 근 찾기 98
7.2. 미분 99
7.3. 적분하기 100
7.4. iris 데이터 100
7.4. mtcars 101

8. apply 함수들 103
8.1. apply() 104
8.2. lapply() 107
8.3. sapply() 109
8.4. tapply 110
8.5. mapply() 113

9. doBy 패키지 115
9.1. summary() 115
9.2. quantile() 116
9.3. summaryBy() 119
9.4. orderBy() order() 120
9.5. splitBy() split() 122
9.6. sampleBy() sample() 125

10. 기타 함수들 129
10.1. subset() 129
10.2. merge() 131
10.3. sort(), order() 135
10.4. with(), within() 136
10.5. attach(), detach() 138
10.6. which(), which.max(), which.min() 139
10.7. aggregate() 140
10.8. stack(), unstack() 141

제4부. 데이터 조작 II 144

11. sqldf, plyr, reshape2, data.table 144
11.1. sqldf 패키지 144
11.2. plyr 패키지 145
11.2.1. adply() 145
11.2.2. ddply() 146
11.3. transform(), summarise(), subset() 148
11.3.1. transform() 148
11.3.2. summarise() 149
11.3.3. subset() 149
11.4. m*ply() 150
11.5. reshape2 패키지 151
11.5.1. melt() 151
11.5.2. complete.cases()함수를 사용하여 결측치를 처리할 수 있다. 152
11.6. data.table 패키지 153
11.6.1. 데이터 접근 153
11.6.2. system.time() 155
11.6.3. 데이터 테이블 병합 155

12. 기타 함수 157
12.1. foreach() 157
12.2. doParallel(), doMC() 158
12.3 print() 158
12.4. sprintf() 159
12.5. cat() 159
12.6. system.time() 160
12.7. Rprof() 161

제 5부 시각화 163

13. ggplot 163
13.1. 산점도 164
13.2. 그래픽 옵션 165
13.2.1. 축 이름(xlab, ylab) 165
13.2.2. 그래프 제목(main) 165
13.2.3. 점의 종류(pch) 165
13.2.4. 점의 크기(cex) 166
13.2.5. 색상(col) 166
13.2.6. 좌표축 값의 범위(xlim, ylim) 167
13.2.7. multi plot 168
13.2.8. type 169
13.2.9. 그래프 배열 170
13.3. 지터(jitter) 171
13.4. 점(points) 172
13.5. 선(lines) 174
13.6. 직선(abline) 176
13.7. 곡선(curve) 177
13.8. 다각형(polygon) 178
13.9. 데이터의 식별 180
13.9.1. 문자열(text) 180
13.9.2. 데이터의 표시 181
13.10. 범례(legend) 182
13.11. matplot () 183
13.11. 상자 그림(boxplot) 183
13.12 히스토그램(hist) 187
13.13. 밀도 그림(density) 189
13.14. 막대 그림(barplot) 190
13.15. 파이 그래프(pie) 191
13.16 모자이크 플롯(mosaicplot) 192
13.17. 산점도 행렬(pairs) 194
13.18. 투시도(persp), 등고선 그래프(contour) 195
13.18.1. persp() 195
13.18.2. contour() 198

Klover 리뷰 (0)

구매하신 책에 Klover 리뷰를 남겨주시면 소정의 포인트를 적립해 드립니다. 안내

리뷰쓰기
0 /10
좋아요
잘읽혀요
정독해요
기발해요
유용해요
기타
  • 등록된 글이 없습니다.

북로그 리뷰 (0) 전체보기 쓰러가기

바로가기