2022-12-06 데이터마이닝_12

Featured image for 2022-12-06 데이터마이닝_12

  기말고사로 밀린 포스팅 ^^ 1. 감정 추측 글의 분위기를 추측한다. 영어만 가능하다. imagine dragons의 노래 3곡의 분위기를 측정해보았다. 2. Wikipedia 사용 Orange에서 제공하는 Wikipedia 기능을 사용하면 위키에 있는 검색결과를 바로 코퍼스로 가져올 수 있다. 위키피디아에 teemo 검색. ^오^

2022-11-29 데이터마이닝_11

Featured image for 2022-11-29 데이터마이닝_11

기말고사 준비로 밀린 포스팅 ^^ 1. 문자열 분석 word cloud를 클릭해서 보면 아래와 같은 결과를 볼 수 있다. preprocess를 한 것과 안 한 것의 차이다. in, the, to, of와 같은 불필요한 것들을 제거한다. (이 외에도 preprocess의 역할은 더 다양하다.) 2. 실습_워드클라우드 자기가 스스호 선정한 주제로 직접 위드 클라우드 그려보기. 출처 : https://ftw.usatoday.com/lists/league-of-legends-patch-notes-preseason-2023 롤 프리시즌 패치노트에 … 더 읽기

2022-11-26 데이터마이닝_10

Featured image for 2022-11-26 데이터마이닝_10

  1. 비지도 학습 비지도 학습으로 k-Means와 Hierarchical Clustering을 사용해 봤다. 가. k-Means fixed: 5 : 이미지를 5가지로 분류 나. Hierachical Clustering 이미지를 분류할 경우에는 Ward를 선택한다고 한다. 2. 실습_비지도 학습 이미지 다운로드 : 구글 fixed: 2 : 이미지를 2가지 분류 맥주와 소주 이미지를 가지고서 한번 분류하도록 시켜보았다. 오… 생각보다 똑똑한데? 고든 램지도 극찬한 CASS … 더 읽기

2022-11-26 데이터마이닝_9

Featured image for 2022-11-26 데이터마이닝_9

1. Test & Score 이렇게만 보면 잘 모르겠으니깐…. 출처 : https://orangedatamining.com/widget-catalog/evaluate/testandscore/ 가. 실습 직접 데이터를 구해서 학습시키는 실습을 해보았다. 데이터 출처 : https://www.data.go.kr/data/15070340/fileData.do 주야, 요일, 발생지시도, 가해자법규위반, 도로 형태, 가해자_당사자 종별을 통해서 사고유형을 올바르게 찾아내는지 확인해보자. 위와 같이 아이콘들을 배치/연결한다. 모델로 Tree, Random Forest. kNN을 사용한다. 사고 사망 통계의 여러 요소 중 ‘사고유형-대분류’를 타겟하여 진행했다. … 더 읽기