본문 바로가기

kt aivle

(8)
kt_aivle8_머신러닝 이번 주는 머신러닝을 배운다. 머신러닝은 많이 해봤지만, 그래도 새롭게 알게 되거나, 개념을 더 자세히 알게 되거나, 잊고 있던 것을 상기시킬 수 있어서 좋다. 머신러닝 변수들에 NaN이 있는지 확인 df.isna().sum() 변수에 NaN이 포함된 행 제거 df.dropna(subset=['a'], axis=0, inplace=True) #axis=0을 해줘야 행이 제거 df.dropna(여러개의 열 리스트, axis=0, inplace=True) NaN값 처리하기 앞/뒤 값으로 채우기 (시계열에서 많이 사용) method='ffill': 바로 앞의 값으로 채우기 method='bfill': 바로 뒤의 값으로 채우기 df['a'].fillna(method='ffill', inplace=True) 선형..
kt_aivle7_웹크롤링 학교 다닐 때 웹크롤링 수업을 들은 적이 있다. 그 당시에 흥미가 갔지만, 한 학기 수업이라서 그런가 더 많이 배우지 못해 아쉬웠다. 그런데 이번 기회에 웹크롤링 수업을 들을 수 있어서 좋았다. 많이 배워가야겠다. 웹크롤링 웹크롤링 방법 웹페이지의 종류 : 정적인 페이지, 동적인 페이지 request 이용 : html, json Danamic : 동적인 페이지 – json 예) 동적 페이지: 더보기란이 있어서 그거 누르면 더 내용이 보이는 거!이건 url이 안 바뀐다. (화면 변경 o) Static : 정적인 페이지 – html 예) 정적 페이지: 페이지수 1,2,3 등이 있고 다른 페이지 누르면 내용 바뀌면서 url까지 바뀐다. (화면 변경 x) selenium 브라우저를 직접 열어서 데이터를 받는다...
kt_aivle6_클래스 웹크롤링 수업시간에 잠시 클래스를 알려주셨다. 클래스는 많이 써보지 않아서 생소했는데 이번 기회에 배우게 되어서 좋았다. 클래스 : class 클래스는 변수와 함수가 많아서 가독성이 떨어질 때 하나로 묶어서 효율적으로 작성하고 실행하는 문법이다. 그리고 객체지향을 구현한 문법이다. 객체지향 구현이란? 실제세계를 모델링하여 프로그램을 개발하는 개발 방법론 - 협업의 향상 효과를 준다. 사용법 - 클래스선언(코드작성) > 객체생성(메모리사용) > 메서드실행(코드실행) - class, self, __init__() - 클래스는 사용자정의 데이터타입이다. (우리가 직접 만듦) - 데이터타입에 따라 사용가능한 변수와 메서드가 다르다. 인스턴스 메소드 # 예) 재고 class stock: today = 100 de..
kt_aivle5 오늘까지 알차게 수업을 들었다. 이제 주말이다! 수업이 점점 깊어지는 게 느껴진다. 내가 아는 부분은 쉽지만 모르는 분야나 부분은 어렵다. 데이터 분석 및 의미찾기 그래프(시각화) : 산점도 숫자 vs 숫자를 비교할 때 중요한 관점이 '직선'(Linearity)이다. sns.scatterplot(x='x변수',y='y변수',data=dataframe이름) pairplot 한 번에 모든 산점도 그리기 : 시간이 오래 걸린다. sns.pairplot(dataframe이름) jointplot 산점도와 각각의 히스토그램을 함께 보여준다. sns.jointplot(x='x변수', y='y변수', data = dataframe이름) regplo..
kt_aivle4 데이터처리에 대해서 배웠다. 데이터 구조 만들기 모델링이 가능하려면 데이터의 모든 셋이 값이 있어야 하고 값은 모두 숫자여야 한다. 또, 필요시 숫자의 범위를 맞춰줘야 한다. 전처리를 할 때는 비어 있는 값은 값을 채워주고 숫자가 아닌 것은 숫자로 바꿔줘야 한다. 데이터프레임 변경 - 열 이름 변경 모든 열 이름 변경 Data.columns = [‘새로운칼럼이름’,…..] 모든 열의 새로운 열이름을 다 적어준다. 일부 열 이름 변경 Data.rename(columns = {‘기존열’ : ‘새로운열이름’, …..}, inplace = True) inplace = True는 변경사항이 실제 반영되게 해 준다.즉 새로운 변수에 할당하지 않아도 저렇게만 해주면 값이 반영되어 바뀐다. - 열 추가 data[‘새롭..
kt_aivle3 2023.08.11 어제 배웠던 python 프로그래밍을 이어서 배웠다. 특히 넘파이와 데이터프레임 조회 및 집계에 대해 배웠다. 범주형과 수치형 구분 법 1의 3배가 3이 되는가 - 수치형 1월의 3배가 3월이 되는가 - 범주형 자동완성 기능이 있다. 몇 자 적고 Tab을 치면 자동완성이 된다. 오타를 줄일 수 있어서 중요하고, 여러 개일 때는 선택도 가능하다. Axis 0의 의미 => 데이터의 건수를 의미한다. Eg) 2차원 데이터 (axis0, axis1) –> (100,10) 10개의 값으로 구성된 데이터가 100건있다. 3차원 데이터 (axis0, axis1, axis2) –> (200,21,8) 21행 8열 크기의 2차원 데이터가 200건 Reshape 배열을 사용할 때 다양한 형태(shape..
kt aivle_2 kt 에이블스쿨 2023.08.10 수업 오늘은 python 프로그래밍을 다뤘다. git 할 때는 너무 어려웠는데 이번 수업은 나에게 친숙해서 수월하게 할 수 있었다. python을 주로 해오던 나에게는 다시 한번 복습을 할 수 있었던 기회였다. 까먹고 있던 부분들을 다시 상기해준 부분들이나, 중요한 부분, 알아두면 좋은 부분들 위주로 적었다. anaconda prompt 내pc에서 c:를 선택 후 사용자 -> user -> 폴더 생성 prompt에 cd 폴더이름 입력 후 jupyter notebook을 치면 그 폴더로 바로 갈 수 있다. ctrl + c를 누르면 아나콘다 prompt 종료 코드셀 : 실제 코드를 작성하고 실행하는 셀 마크다운 셀(텍스트 셀) : 설명문 등을 작성하는 셀 셀 전환 방법 마..
kt aivle 시작 kt 에이블 스쿨 4기에 지원했고, 서류와 인적성, 코딩을 본 후 다행히도 합격했다. 나의 전형은 AI개발자 전형이었고 이제부터 시작이다! 파이팅 2023.08.09 어제 오리엔테이션이 끝나고 본격적인 수업을 오늘 시작했다. IT프로젝트 관리도구인 git에 대해 공부했다. 잘 안 다뤄봤기 때문에 너무 어려웠다. 그래도 강사님이 잘 가르쳐주셔서 많은 것을 배웠다. Visual studio과 Github를 이용하여 수업했다. 버전관리는 디버깅을 위해서 하는 것이다. 커밋(commit)은 버전을 만든다. Working directory는 휴먼의 영역 Repository는 머신의 영역 Head: 현재버전 Main: 마지막버전(최신) Head가 가리키는 버전이 부모다. Ckeckout을 해주면 과거로 돌아간다. ..