본문 바로가기

AIFFLE/INFO

(3)
데이터 분석 학습 및 프로젝트를 위한 데이터 수집 사이트, 꿀팁 정리 학습 내용데이터 수집, 다운로드를 할 수 있는 다양한 사이트들을 공유하고자 한다데이터 분석을 하려하는데 필요한 데이터셋을 좀 더 쉽게 찾을 수 있다.  빅데이터 분석을 위한 데이터셋 공모전이나 데이터 분석 공부를 위해서는 충분한 양의 데이터 셋 확보가 중요한 과제이다데이터를 수집하기 위해서는 시간과 비용이 많이 소모된다이를 줄이기 위해서 기존에 공개된 데이터를 먼저 찾아보는 것이 중요하다이를 위해서 몇 개의 유용한 사이트를 공유하고자 한다 공공데이터AI HUBhttps://aihub.or.kr/- 다양한 데이터셋이 많고 대용량의 데이터가 많은 편이라 실제 큰 프로젝트나 딥러닝 학습용 데이터셋을 찾을 때 가장 유용한 것 같다 공공 데이터 포털https://www.data.go.kr/- 우리나라의 여러 공..
numpy 정수형 데이터의 처리방식으로 인한 오류 학습 내용python에서의 정수형 데이터 처리 방식을 이해한다numpy의 정수형 데이터 처리방식을 이해한다 (C언어) 들어가며p 값의 변화에 따른 norm 값의 변화를 직접 확인해보고자 아래 코드를 실행시키다 보니 19부터 numpy 패키지를 통해 계산한 값과 직접 하드코딩으로 계산한 값의 차이가 나타나기 시작했다. 이에 대한 힌트를 찾기 위해 numpy github를 찾아봤다.- np.linalg.norm(x, ord=p)의 처리방식을 비교하여 이 문제를 해결할 수 있었다.https://github.com/numpy/numpy/blob/d35cd07ea997f033b2d89d349734c61f5de54b0d/numpy/linalg/linalg.py#L2536위 데이터는 정수형으로 저장되어 있어서 Pyt..
다양한 평균 측정 방식에 대한 이해 - 산술, 조화, 기하평균 학습 내용다양한 평균 측정 방식에 대해 정리해 보고자 한다상황에 따라 어떤 평균 값을 사용해야 하는지 이해해보자 들어가며- 평가지표로 많이 쓰는 F1 score에 대해 학습하다가 조화평균을 어떨 때 쓰는지 이해해보고 싶어서 정리해보게 되었다. 1. 산술평균 (Arithmetic Mean)수식산술평균은 가장 일반적인 평균 계산 방식이다.$ n $개의 데이터 $ x_1, x_2, \ldots, x_n $에 대해 산술평균 $\bar{x}$는 다음과 같이 계산된다. $$ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i $$예시테스트 점수: 학생들의 시험 점수를 평균 내어 전체 성적의 경향을 파악하고자 할 때.연봉: 조직의 연봉 데이터에서 평균 연봉을 파악할 때.일반적인 산출물: 매출액,..

반응형