경상대 빅데이터이해 기말 정리본 A+
- 최초 등록일
- 2023.06.30
- 최종 저작일
- 2023.06
- 28페이지/ 어도비 PDF
- 가격 2,500원
소개글
"경상대 빅데이터이해 기말 정리본 A+"에 대한 내용입니다.
목차
1. 빅데이터 분석 기법과 데이터 마이닝
1) 데이터 마이닝
2) 기법, 도구
2. 정형 데이터 마이닝
1) 연관관계 분석
2) 군집분석
3) 사례기반추론과 의사결정나무
3. 비정형 데이터 마이닝
1) 텍스트 / 웹 / 오피니언 마이닝
2) 소셜 네트워크 분석
4. 인공지능
5. 논리게이트와 퍼셉트론
1) 퍼셉트론 코드
2) 비선형성과 XOR 게이트
6. 기계학습 자세히
1) 지도학습 / 비지도학습
7. 데이터 기반 학습
1) 활성화 함수
2) 텐서
8. 학습과 기계학습
9. 인공지능 실제 예시
1) KNN 알고리즘, 거리 계산
10. 빅데이터 분석 과정과 기술
1) 수집 / 저장 / 처리 기술
2) 분석 / 시각화 기술
11. 데이터 시각화
본문내용
-KNN 알고리즘 : (분류와 회귀 문제 해결O)
K 최근접 이웃 : 데이터는 특정 공간에 있는 다른 데이터와 거리 기준으로 계산
-분류: 군집A,군집B 사이 빨간 점 x A(a1,2,3), B(b1,2,3)과 x의 거리
→ 더 가까운 군집으로 빨간점 배치 (점들 중 과반수 이상 거리 가까운 군집에 속함)
-회귀: 더 가까운 군집의 중심점 출력(군집A 특성값 출력→가장 단순한 특성값은 군집 중심점 출력) -거리 계산 : 계산 방법에 따라 군집의 구성 정확도 크게 다름
└ 맨해튼 거리/ 유클리디안 거리/ 해밍 거리/ 마할라노비스 거리
- 맨해튼 거리: 바둑판 모양 거리, 짧은 사선으로 갈 수 X
→가로축, 세로축 구분하여 거리 차이 더하는 것(차이 계산 시 부호의 유무 주의)
일반적 - 유클리디안 거리: XY 평면 설명하면서 두 점 간 최단 거리 계산 방법 소개
→ 최단 거리 사용 (피타고라스정리와 동일; 밑변 제곱+높이 제곱=빗변의 제곱) ex) 점 A(5,20), 점 B(10,5) 유클리디안 거리? sqrt((5-10)^2+(20-5^2) ∴15.81
*거리의 일반적인 성질 (D:두 점 거리 나타내는 기호, x와y: 평면 위 임의 위치의 점)
: D(x,y) >= 0 / D(x,y)=D(y,x)은 대칭이다 / 우회 하는 경우 거리 좁힐 수X / D(x,z)<=D(x,y)+D(y,z)
- 해밍 거리: 인접한 점과 단 한 비트만 차이남
십진수: 0 1 2 3 4 5 6 7 / 이진수: 0 1 10 11 100 101 110 111
*리차드 해밍 “같은 길이의 문자열 있을 때 그 문자열에서 같은 문자열 제외 나머지 문자열 개수가 어떻게 되는지 계산”
→ 111과 가로, 세로, 아래로 연결된 점들의 값 비교 ⇒ 인접한 점들과 한 자리씩 차이로 해밍 거리 1
→ 111과 000 비교 ⇒ 세 번 이동해야함. 해밍 거리 3 (경로:111→011→001→000)
ex) 10111과 10010의 해밍 거리? 1 (같은 자리 비트가 서로 다른 경우 해밍 거리 1차이 남)
- 마할라노비스 거리 : 변수가 여러 개 있는 다변량 데이터에 적합
(나머지 3개는 변수가 하나일 때 거리 측정하는 기법)
참고 자료
없음