본문 바로가기
콤퓨타/빅데이터입문

빅데이터입문 (2) - 빅데이터 프로젝트 주제선정 / 계획서 작성 23.09.13

by 다_녤 2023. 9. 17.
반응형

Project Proposal 작성_9월 중순

전반적인 프로젝트 주제 선정을 어떻게 해야 할지에 대해 설명했습니다.

 

데이터마이닝? (Data Mining)

데이터마이닝 프로젝트는 기본적으로 흥미로운 것에 대한 추출이라고 생각해야 합니다.

Data mining은 Knowledge extraction, data analysis, data science, information harvesting, business intelligence, predictive analysis 등 표현이 상당히 많습니다.

 

데이터마이닝은 크게 3가지 process를 거치는데

input data -> data preprocessing -> data mining -> postprocessing -> pattern, information, knowledge, etc

와 같은 순서로 input data에 대한 처리가 이뤄집니다.

 

고려해야할 사항은 대표적으로  아래 4가지가 있음

Data와 Datatypes

Data mining functions: 목적을 위한 수단, 어떤 방식으로 분석을 진행할 것인지

    Generalization, Association and correlation analysis, Classification, Cluster analysis, Outlier analysis 등

Techniques utilized: 수단을 위한 방법

Applications adapted: How to use? 어디에 적용할 것인지

 

현재 빅데이터 분야에서 대두되는 issues는 아래와 같음

Mining Methodology

User Interaction

Efficiency and Scalability

Handling complex types of data

Data mining and societly

 

주제선정시 이해가능(understandable)하고 흥미(interesting)로워야 한다고 한다..

아무래도 내가 가진 도메인은 야구, 주식과 같은 것들이라 세이버메트릭스(https://ko.wikipedia.org/wiki/%EC%84%B8%EC%9D%B4%EB%B2%84%EB%A9%94%ED%8A%B8%EB%A6%AD%EC%8A%A4)와 같은 주제를 선정해봐도 괜찮겠다는 생각이 들었다.

 

다음주가 proposal submit인만큼 action item으로 고민을 많이 해봐야겠다.

반응형