분류 전체보기 (38) 썸네일형 리스트형 AICE자격증 및 코딩마스터스 마스터 kt에이블스쿨 1차 코딩마스터스에서 70문제 이상을 풀어 마스터 상장(오픈배지)를 받았다. 또, AICE 자격증 시험을 KT에이블스쿨에서 무료로 지원해줬다. 그래서 꼭 합격하기 위해 공부를 하였고 다행히 90점으로 합격하였다. 전처리&시각화 어느 부분에서 10점이 깎였을지 궁금하지만 나와있지 않아서 아쉽다ㅠㅠ AICE자격증과 마스터를 얻어서 뿌듯하다. 더욱 바쁘게 살아가야 할 거 같다. 이 두 개의 오픈배지가 생성되었는데 그건 깃허브에 오픈배지 링크를 올려놔야겠다. 대회 우수상 수상 한국경영과학회와 벡스인텔리전스가 주최하는 2023 DMC 빅데이터아이디어오디션 대회에 참가했다. 2023년 9월부터 시작하여 11월에 수상하였다. 유아동 그림 분석 알고리즘을 개발하는 것인데 4명과 함께 팀을 이루어 참여했다. 과정 이미지 데이터를 라벨링하여 전처리하고 클래스를 만들어 분류했다. 이미지 객체 모델인 yolo모델을 사용하여 유아동 그림 데이터를 18개의 요소로 분류하는 ai알고리즘을 개발했다. 예측된 이미지에서 좌표를 추출하여 좌표를 가지고 측정하였다. 최종적으로 요소별 정확도를 판단하고 모델을 개발하여 발표장에서 발표하였다. 시상식은 KAIST서울캠퍼스에서 하였고 우리는 우수상을 받았다. 이미지 데이터를 가지고 공부만 해봤지 실제로 이미지 데이터를 가지고 예측 대회에 나간 것은 처음이었다.. kt_aivle8_머신러닝 이번 주는 머신러닝을 배운다. 머신러닝은 많이 해봤지만, 그래도 새롭게 알게 되거나, 개념을 더 자세히 알게 되거나, 잊고 있던 것을 상기시킬 수 있어서 좋다. 머신러닝 변수들에 NaN이 있는지 확인 df.isna().sum() 변수에 NaN이 포함된 행 제거 df.dropna(subset=['a'], axis=0, inplace=True) #axis=0을 해줘야 행이 제거 df.dropna(여러개의 열 리스트, axis=0, inplace=True) NaN값 처리하기 앞/뒤 값으로 채우기 (시계열에서 많이 사용) method='ffill': 바로 앞의 값으로 채우기 method='bfill': 바로 뒤의 값으로 채우기 df['a'].fillna(method='ffill', inplace=True) 선형.. kt_aivle7_웹크롤링 학교 다닐 때 웹크롤링 수업을 들은 적이 있다. 그 당시에 흥미가 갔지만, 한 학기 수업이라서 그런가 더 많이 배우지 못해 아쉬웠다. 그런데 이번 기회에 웹크롤링 수업을 들을 수 있어서 좋았다. 많이 배워가야겠다. 웹크롤링 웹크롤링 방법 웹페이지의 종류 : 정적인 페이지, 동적인 페이지 request 이용 : html, json Danamic : 동적인 페이지 – json 예) 동적 페이지: 더보기란이 있어서 그거 누르면 더 내용이 보이는 거!이건 url이 안 바뀐다. (화면 변경 o) Static : 정적인 페이지 – html 예) 정적 페이지: 페이지수 1,2,3 등이 있고 다른 페이지 누르면 내용 바뀌면서 url까지 바뀐다. (화면 변경 x) selenium 브라우저를 직접 열어서 데이터를 받는다... kt_aivle6_클래스 웹크롤링 수업시간에 잠시 클래스를 알려주셨다. 클래스는 많이 써보지 않아서 생소했는데 이번 기회에 배우게 되어서 좋았다. 클래스 : class 클래스는 변수와 함수가 많아서 가독성이 떨어질 때 하나로 묶어서 효율적으로 작성하고 실행하는 문법이다. 그리고 객체지향을 구현한 문법이다. 객체지향 구현이란? 실제세계를 모델링하여 프로그램을 개발하는 개발 방법론 - 협업의 향상 효과를 준다. 사용법 - 클래스선언(코드작성) > 객체생성(메모리사용) > 메서드실행(코드실행) - class, self, __init__() - 클래스는 사용자정의 데이터타입이다. (우리가 직접 만듦) - 데이터타입에 따라 사용가능한 변수와 메서드가 다르다. 인스턴스 메소드 # 예) 재고 class stock: today = 100 de.. kt_aivle5 오늘까지 알차게 수업을 들었다. 이제 주말이다! 수업이 점점 깊어지는 게 느껴진다. 내가 아는 부분은 쉽지만 모르는 분야나 부분은 어렵다. 데이터 분석 및 의미찾기 그래프(시각화) : 산점도 숫자 vs 숫자를 비교할 때 중요한 관점이 '직선'(Linearity)이다. sns.scatterplot(x='x변수',y='y변수',data=dataframe이름) pairplot 한 번에 모든 산점도 그리기 : 시간이 오래 걸린다. sns.pairplot(dataframe이름) jointplot 산점도와 각각의 히스토그램을 함께 보여준다. sns.jointplot(x='x변수', y='y변수', data = dataframe이름) regplo.. kt_aivle4 데이터처리에 대해서 배웠다. 데이터 구조 만들기 모델링이 가능하려면 데이터의 모든 셋이 값이 있어야 하고 값은 모두 숫자여야 한다. 또, 필요시 숫자의 범위를 맞춰줘야 한다. 전처리를 할 때는 비어 있는 값은 값을 채워주고 숫자가 아닌 것은 숫자로 바꿔줘야 한다. 데이터프레임 변경 - 열 이름 변경 모든 열 이름 변경 Data.columns = [‘새로운칼럼이름’,…..] 모든 열의 새로운 열이름을 다 적어준다. 일부 열 이름 변경 Data.rename(columns = {‘기존열’ : ‘새로운열이름’, …..}, inplace = True) inplace = True는 변경사항이 실제 반영되게 해 준다.즉 새로운 변수에 할당하지 않아도 저렇게만 해주면 값이 반영되어 바뀐다. - 열 추가 data[‘새롭.. kt_aivle3 2023.08.11 어제 배웠던 python 프로그래밍을 이어서 배웠다. 특히 넘파이와 데이터프레임 조회 및 집계에 대해 배웠다. 범주형과 수치형 구분 법 1의 3배가 3이 되는가 - 수치형 1월의 3배가 3월이 되는가 - 범주형 자동완성 기능이 있다. 몇 자 적고 Tab을 치면 자동완성이 된다. 오타를 줄일 수 있어서 중요하고, 여러 개일 때는 선택도 가능하다. Axis 0의 의미 => 데이터의 건수를 의미한다. Eg) 2차원 데이터 (axis0, axis1) –> (100,10) 10개의 값으로 구성된 데이터가 100건있다. 3차원 데이터 (axis0, axis1, axis2) –> (200,21,8) 21행 8열 크기의 2차원 데이터가 200건 Reshape 배열을 사용할 때 다양한 형태(shape.. 이전 1 2 3 4 5 다음