2022-11-26 데이터마이닝_9

Featured image for 2022-11-26 데이터마이닝_9

1. Test & Score 이렇게만 보면 잘 모르겠으니깐…. 출처 : https://orangedatamining.com/widget-catalog/evaluate/testandscore/ 가. 실습 직접 데이터를 구해서 학습시키는 실습을 해보았다. 데이터 출처 : https://www.data.go.kr/data/15070340/fileData.do 주야, 요일, 발생지시도, 가해자법규위반, 도로 형태, 가해자_당사자 종별을 통해서 사고유형을 올바르게 찾아내는지 확인해보자. 위와 같이 아이콘들을 배치/연결한다. 모델로 Tree, Random Forest. kNN을 사용한다. 사고 사망 통계의 여러 요소 중 ‘사고유형-대분류’를 타겟하여 진행했다. … 더 읽기

2022-11-05 AI입문_7

Featured image for 2022-11-05 AI입문_7

  1. 기울기 강하 기법 가. 학습법 개관 (1) 신경망 학습법 개관 (2) 에러 정정 기법 주어진 입력 샘플에 대해 출력을 산출한다. 이후 출력과 목표 출력 간의 차이가 줄어들도록 가중치를 변경한다. 나. 손실함수 (1) 손실 함수 손실 함수는 목표치와 실제 출력 간의 차이(손실, 에러)를 계량화하는 함수. 에러 함수의 종류는 다양한다. ex) 평균제곱에러, 교차엔트로피 에러 등 … 더 읽기

2022-10-06 데이터마이닝_5

Featured image for 2022-10-06 데이터마이닝_5

1. Random Forest 기계 학습에서의 랜덤 포레스트는 분류, 회귀 분석 등에 사용되는 앙상블 학습 방법의 일종이다. 훈련 과정에서 구성한 다수의 결정 트리로부터 부류(분류) 또는 평균 예측치(회귀 분석)를 출력함으로써 동작한다. ( 출처 : https://ko.wikipedia.org/wiki/랜덤_포레스트 ) ( 출처 : https://eunsukimme.github.io/ml/2019/11/26/Random-Forest/ ) 임의의 여러 개의 Decision tree를 만들기에 Random forest라고 하는 것 같다. Random Forest의 구체적인 원리는 수업의 … 더 읽기