데이터마이닝모델링과사례

페이지 정보

profile_image
작성자여의도목장갑 조회 12회 작성일 2022-01-10 21:24:21 댓글 0

본문

뉴욕 현지 Data Scientist가 알려주는 "데이터 마이닝 VS 머신 러닝, 뭐가 다를까?"

쉽게 혼용되기도 하고 헷갈리기도 하는 데이터 마이닝과 머신 러닝 개념에 대한 설명입니다.
Jeongwon Moon : 진짜 알기쉬운 예를 들어주셔서 비전공자로써 무엇을 공부해야하는지 조금이나마 알수 있었습니다. 사실 저를 포함한 비전공자는 데이타 사이언스의 무엇을 공부를 해야하느냐를 모르는 경우가 많다고 생각하는데, 이 가이드라인을 제시해주시는건 데싸노트님이 유일한것같아요!! 저는 input data에서 output data를 계산해주는 regression 알고리즘과, 전기자동차의 cost와 environmental load를 처벌로 하는 reinforce learning에 관심이 가네요! 영상 너무 좋아서 구독좋아요 알림설정+댓글이 멈추질 않네요 !!
이승태 : 영상 퀄리티 미쳤습니다... 대박나실거에요..!! 통계학 석사 졸업자이긴 해도 현업에 대한 경험이 없다보니, 명확하게 이해가 안되는 부분이 많았는데, 이 채널에서 많은 것들을 정리할 수 있었습니다^^
JOOHO KIM : 저는 계량경제학쪽 백그라운드라 데이터 마이닝 쪽에 가깝네요 ㅎㅎ안그래도 같은 regression이라도 두 가지 관점에서 어떻게 다른지 막연히만 알고 있었는데, 이번 영상을 통해서 확실히 개념정리가 되었습니다. 좋은 설명 감사드립니다.
새미자 : 이해하기 너무 쉽게 설명하시는데 ㄷㄷ;; 자주 올려줘요!!!
日奈森 : 예시가 잘 이해가 되어서 좋습니다! 감사합니다

Virtual SAS School - 현업 전문가로부터 듣는 데이터 마이닝 첫 걸음

빠른 비즈니스 문제 해결을 위해 인사이트를 찾고, 치열한 시장 경쟁에서 우위를 점하기 위해서는 정확한 분석 모델 생성이 그 무엇보다 중요합니다. 기존 확인하지 못하였던 분석 패턴을 발견하고 이를 업무에 반영하면 기업 전반의 의사 결정자들이 효과적으로 전략을 수립하는 데 큰 도움이 될 수 있습니다.

SAS에서 준비한 금번 '데이터 마이닝 첫 걸음' 웨비나에서는 탐색 모델링 (군집분석, 연관성 분석) 및 예측 모델링 (의사 결정 트리, 회귀 및 신경망 모델)을 수행하기 위한 기본 개념을 소개하고, SAS® Enterprise Miners 의 다양한 기능을 사용하여 분석 흐름도를 구성하는 데 필요한 주요 내용을 소개합니다. 이를 통해 누구나 손쉽게 확장 가능한 방식의 통합 분석을 활용하여 데이터 마이닝 이점을 직접 확인하실 수 있습니다.
한영덕 : 너무나 유익한 정보네요.
김용백 : 좋은정보 감사합니다
김용백 : 인스타그램 팔로우 아이디 bk9966

How data mining works

Follow my podcast: http://anchor.fm/tkorting

In this video we describe data mining, in the context of knowledge discovery in databases. Nowadays (around 2020) people are using the term 'data science' however with a lot of similarity to what we see in this video, using a reference from 1997.

This presentation is available at https://prezi.com/v2zmhstglmoi/?utm_campaign=share\u0026utm_medium=copy

More videos on classification algorithms can be found at
https://www.youtube.com/playlist?list=PLXMKI02h3_qjYoX-f8uKrcGqYmaqdAtq5

Subscribe to my channel!
Harshal Sanghvi : Very well explained.
Steve Walczak : Thanks Thales for a great video. It was short and to the point. I will be pointing my students here.

One question I see that you get over and over again is about the problems of correlated data. Another reason to find uncorrelated data is that many knowledge discovery engines and tools, such as neural networks and almost every statistical package do not work with with highly correlated variables. That is because if you end up using two or more correlated variables in a prediction algorithm, the correlated variables tend to bias the direction of the prediction to be based on what those variables represent. So if you are using five variable, three correlated and two independent, then the three correlated variables own 60% of the influence on the outcome (potentially, assuming the prediction engine starts with balanced effect).
Thales Sehn Körting : Dear 叶熙泽
Suppose you have 3 variables with the following feature values:
x1 = [1, 2, 5, 6]
x2 = [4, 2, 7, 9]
x3 = [1, 2, 5, 6]

x1 and x3 are very correlated (i.e. equal in this case). Then it is not efficient to any algorithm to use both variables, since computations of distances and so on will return equal values. So the proposal here is to use only x1 and x2.

Regards
Fred Hm : This is the BEST explanation i found so far , so thanks a lot!
Siva Ji : Dear Thales,

It was an awesome presentation!! very happy to learn from you now and ever.. Subscribed!

... 

#데이터마이닝모델링과사례

댓글목록

등록된 댓글이 없습니다.

전체 10,140건 169 페이지
게시물 검색
Copyright © www.gangbuklib.seoul.kr. All rights reserved.  Contact : help@oxmail.xyz