2022-11-13 데이터마이닝_8

Featured image for 2022-11-13 데이터마이닝_8

1. 연관규칙 2 가. 실습 1 (1) 질문? 왜 힘들게 하나하나 수동으로 factor로 바꿔주어야 하는가? stringsAsFactors = TRUE로 한 번에 바꿔도 되지 않는가? 나. 실습 2 (1) 결과 해석 lhs, rhs, support, confidence, coverage, lift, count 순서로 출력 1 ~ 17번 : 특정한 연관관계 없음.18번 : ‘고급 자전거’를 선택하는 선택한 사람이 ‘제주도에 바다가 보이는 20평땅’을 … 더 읽기

2022-11-13 데이터마이닝_7

Featured image for 2022-11-13 데이터마이닝_7

1. 연관규칙 대량의 데이터에서 빈번하게 발생하는 데이터의 패턴을 찾는 것. 맥주를 사는 사람은 마른안주도 함께 구매한다. 장바구니 분석이라고도 함. 출처 : https://welcome-to-dewy-world.tistory.com/61 가. 실습 baseball, basketball 그리고 soccer에 들어있는 0과 1을 숫자가 아닌 factor로 인식하도록 한다. read.csv(…., stringsAsFactors = true) 옵션을 사용하지 않은 것은 string 타입이 아니기 때문이다. 사용하면 이상하게 동작한다. 주의할 것. 출처 : … 더 읽기