본문 바로가기

파이썬12

Python을 이용한 데이터 분석 - 텍스트 빈도 분석 (2) ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. 한글 [ 한글 분석 + 워드클라우드 ] 한글 뉴스 기사의 키워드 분석 1. 목표 설정 '4차 산업혁명'에 관한 한글 기사에서 명사 키워드 분석 2. 핵심 개념 이해 (1) 형태소 1) 언어에서 의미가 있는 가장 작은 단위 2) 단어는 의미를 갖는 문장의 가장 작은 단일 요소로 문장에서 분리될 수 있는 부분 3) 독립형 형태소인 단어도 있지만, 대부분의 단어는 형태소와 접사로 구성됨 4) 형태소 분석 : 형태소, 어근, 접두사/접미사, 품사 등 다양한 언어학적 속성으로 구조를 파악하는 것 (2) 품사 태깅 1) 형태소의 뜻과 문맥을 고려하여 품사를 붙이는 것, ex) 가방에 들어가신.. 2022. 6. 22.
Python을 이용한 데이터 분석 - 통계분석 (1) ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. 기술통계분석(회귀분석) [기술 통계 분석 + 그래프] 와인 품질 예측 1. 목표 설정 (1) 목표 : 와인의 속성을 분석한 뒤 품질 등급 예측 (2) 데이터의 기술 통계 구하기 (3) 레드 와인과 화이트 와인 그룹의 품질에 대한 t-검정 수행 (4) 와인 속성을 독립 변수로, 품질 등급을 종속 변수로 하여 선형 회귀 분석 수행 2. 핵심 개념 이해 (1) 기술 통계(요약 통계) 1) 데이터의 특성을 나타내는 수치를 이용해 분석하는 기본적인 통계 방법 2) 평균, 중앙값, 최빈값 등을 구할 수 있음 (2) 회귀 분석 1) 독립 변수 x와 종속 변수 y 간의 상호 연관성 정도를 파악하.. 2022. 6. 5.
Python을 이용한 데이터 분석 - API를 이용한 크롤링 (2) ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. API를 이용한 데이터 수집 공공데이터 API를 이용한 크롤링 1. 공공데이터 활용 신청 (1) 공공데이터포털 회원가입 (2) 출입국관광통계서비스 검색 (3) 오픈 API > 출입국관광통계서비스 (4) '활용신청' 클릭 (5) [OpenAPI 개발계정 신청] 페이지에서 활용목적 선택(ex. 연구(논문 등)) 및 텍스트 박스에 내용 입력(ex. 공공데이터 활용 학습) (6) [OpenAPI 개발계정 신청] 페이지의 [상세기능정보 선택]에서 '출입국관광통계조회'를 선택하고 [라이선스 표시]에서 '동의합니다'에 체크한 뒤 '활용신청' 클릭 (7) 마이페이지 > 오픈API > 개발계정 >.. 2022. 5. 15.
Python을 이용한 데이터 분석 - API를 이용한 크롤링 (1) ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. API를 이용한 데이터 수집 네이버 API를 이용한 크롤링 1. 크롤링이란? (1) 크롤링 웹에서 데이터를 수집하는 작업 크롤러 또는 스파이더라는 프로그램으로 웹사이트에서 데이터 추출 (2) 웹 API 일반적으로 HTTP 통신을 이용할 때 사용 지도, 검색, 주가, 환율 등 다양한 정보를 가지고 있는 웹 사이트의 기능을 외부에서 쉽게 사용할 수 있도록 사용 절차와 규약을 정의한 것 2. 네이버 개발자 가입 (1) 네이버 개발자 센터(https://developers.naver.com/main/) 접속 (2) Products > 서비스 API > 데이터랩 > 오픈 API 이용 신청 .. 2022. 5. 14.
Python을 이용한 데이터 분석 - Numpy ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. Python 데이터 분석 라이브러리 numpy 라이브러리 1. numpy 라이브러리 활용 유무 리스트를 활용한 코드 import matplotlib.pyplot as plt t = [] p2 = [] p3 = [] for i in range(0, 50, 2): t.append(i/10) p2.append((i/10)**2) p3.append((i/10)**3) plt.plot(t, t, "r--", t, p2, "bs", t, p3, "g^") # x, y, format string 차례대로 3번 반복 plt.show() numpy를 활용한 코드 import matplotlib.p.. 2022. 5. 10.
Python을 이용한 데이터 분석 - Matplotlib (4) ICT이노베이션스퀘어 AI기본과정(CNU) 교육을 듣고 정리한 내용입니다. AI기본과정(CNU) 교육 자료를 참고하였습니다. 대중교통 데이터 프로젝트 지하철 유무임별 데이터 1. 지하철 유무임별 이용현황 데이터 정제 데이터 출력 import csv f = open('C:/Users/82109/OneDrive/바탕 화면/subwayfee.csv') subway = csv.reader(f) for row in subway: print(row) 인원 숫자 데이터를 정수로 변환 import csv f = open('C:/Users/82109/OneDrive/바탕 화면/subwayfee.csv') subway = csv.reader(f) next(subway) for row in subway: for i in r.. 2022. 5. 6.