[데이터 엔지니어링 데브코스 4기] 5주차 10/17 TIL
·
데이터 엔지니어링 데브코스
오늘은 어제보다는 괜찮은 김줘입니다! 드디어 1차 프로젝트의 일정표 상 마지막 날이 되었습니다. 방금 멘토님과 팀 미팅을 끝마치고 이 글을 작성 중에 있는데요! 흠..사실 다른 팀의 결과물에 비해 저희 팀 결과물은 굉장히 소박하다고 생각합니다. 사용한 데이터의 양도 적고, 크롤링도 일회성으로 사용했고.. 모델에 이미 데이터를 모두 넣어놓아서.. api의 활용 없이 진행했으니.. 소박할 수 밖에 없겠죠........ 멘토님은 그래도 파이썬에 익숙하지 않고, Django를 처음 쓰는 3명이서 3일만에 이렇게 한 건 잘한 것이라는 말을 해주셨지만...그 뒤에 추후에 한 번만 크롤하는 것이 아닌, 스케줄을 두고 크롤하고, api를 더 활용하게 하면 좋겠다라는 리뷰를 해주셨지만, 아마도 저는 해당 프로젝트는 더 ..
[데이터 엔지니어링 데브코스 4기] 5주차 10/14 TIL
·
데이터 엔지니어링 데브코스
반갑읍니다 여러분!! 오늘도 늦은 밤 죽지 않고 돌아온 김...줘..입니다.. 이번 5주차에 들어서는 앞서 배운 크롤링과 스크래핑, Django를 통한 웹 페이지 시각화 프로젝트를 진행하고 있습니다! 기존 저희 팀은 7명으로 구성되어있었고, 해당 인원을 한 팀으로 진행해도 되지만, 각자 관심 주제나 개인의 생각을 고려하여 2개의 조로 나누어 진행하기로 했습니다! 저희 팀은 3명으로 구성하여, 주제는 만개의 레시피의 월간 랭킹 스크래핑을 통해 시각화를 해주는 방안으로 진행하고 있습니다!나머지 4분은 AI 관련 지식이 있는 분으로 구성이 되어있어, 기업 관련 뉴스 감정 분석으로 진행한다고 합니다! 저도 과거에 배달음식에 대한 감정 분석 프로젝트를 진행한 경험이 있지만, 프로젝트 기간이 4일로 짧고, Djan..
[데이터 엔지니어링 데브코스 4기] 3주차 10/2 TIL
·
데이터 엔지니어링 데브코스
오늘은 웹 크롤링, 웹 스크래핑에 대한 교육에 앞서, 그에 대한 이론과 실습을 진행하였습니다!! 예전에.. 아주 먼 옛날.. 셀레니움으로 크롤링을 한 번 해본 경험이 있던 것 같긴한데... 까마득해요.. 또 데이터 관리 인턴 시절.. 인턴 동기끼리 크롤링? 스크래핑? 을 통해 여러 간단한 프로그램도 만들어봤는데, 사실상 백지 상태인거같아요 ㅋㅋㅋㅋ 오늘 배운 내용은 실습 및 개념 위주라 개념과 BeautilfulSoup를 어떻게 사용하는 지 간단하게 코드를 정리해보았습니다!개념 및 정리Web : 인터넷에서 정보를 교환할 수 있는 하나의 플랫폼!웹 페이지는 HTML 형식으로 되어있고, 웹 브라우저는 클라이언트가 HTTP 요청을 보낸 후, 응답받은 HTML 코드를 랜더링 해준다!웹 크롤링 vs 웹 스크래핑웹..