파이썬 독학17 파이썬으로 웹스크래핑 크롤링 하는 방법 (BeautifulSoup 사용) 웹스크래핑 또는 웹크롤링을 이용해서 웹사이트에서 데이터를 추출해오는 방법에 대해 소개하고자 합니다. 파이썬 라이브러리인 BeautifulSoup을 이용하여 코드 몇줄로 초보자도 쉽게 데이터를 추출할 수 있습니다. 설치하는 방법부터 최종 데이터 추출까지 코드 예시와 함께 살펴보겠습니다. 웹스크래핑 / 크롤링이란? 특정 웹사이트내 데이터들을 추출해오는 것을 웹스크래핑(Web Scraping) 또는 웹 크롤링(Web Crawling)이라고 말합니다. 어떤 사이트에 나와있는 정보들을 엑셀 등의 잘 정리된 표로 추출을 하고 싶은데, 해당 사이트에서 엑셀 등으로 다운로드 받는 기능을 제공하고 있지 않을 때 하나하나 복사 붙여넣기 하는 대신 웹 스크래핑 또는 웹 크롤링을 이용하면 프로그램으로 데이터를 추출해올 수 있.. 2023. 2. 15. 코딩 실력 향상을 위해 LeetCode 리트코드 하세요. 프로그래밍 실력을 향상시키기 위한 가장 좋은 온라인 플랫폼 LeetCode(리트코드)에 대해 소개하고자 한다. LeetCode란 어떤 곳인지, 왜 유명한지, 어떤 걸 얻어갈 수 있는지, 리트코드의 기능과 장점 그리고 어떻게 활용하면 좋은지에 대해 알아보자. LeetCode(리트코드)란? LeetCode는 소프트웨어 엔지니어와 프로그래머들이 코딩 실력을 기를 수 있도록 여러가지 코딩 문제들을 풀 수 있도록 해놓은 온라인 플랫폼이다. 1,500개가 넘는 코딩 문제들이 있고, 해외에서는 이 리트코드 문제들을 취업 코딩 테스트에 활용하고 있기 때문에 프로그래머들이 취업준비할 때 필수적으로 준비하는 곳이다. 대부분의 프로그래밍 언어를 모두 지원한다. C, Java, C++, Python 등 사용하는 프로그래밍 언.. 2023. 2. 8. [파이썬] 아직도 for loop만 쓰시나요? list comprehension 으로 간편하게 코딩하기 파이썬에서는 List Comprehension(리스트 컴프리헨션)이라는 강력한 도구를 사용할 수 있다. 주로 for loop이나 while 문을 돌려야 하는 상황에 대신하여 쓸 수 있다. 몇 가지 예제를 보면서 어떻게 활용할 수 있는지 살펴보자. list comprehension이 간편한 이유 (코드 예제) 만약 numbers라는 리스트 안에 [1,2,3,4,5] 라는 숫자가 담겨 있고, 새로운 리스트에 이 numbers안에 있는 숫자들을 각각 두 배씩 해서 새로 담는다고 가정하자. 가장 먼저 떠오르는 방법은 for 문을 돌려서 하나하나 두 배씩 해서 새로운 리스트에 넣어주는 방법이다. numbers = [1, 2, 3, 4, 5] squared_numbers = [] for num in numbers:.. 2023. 2. 8. [파이썬] 판다스 데이터프레임 loc 과 iloc 인덱싱 사용법 정복하기 파이썬 판다스 데이터 프레임은 데이터 분석을 위한 아주 기본적인 파이썬의 데이터 구조이다. 데이터 분석에 유용하게 활용할 수 있는 기초적인 데이터프레임 인덱싱 방법인 loc과 iloc의 개념, 그리고 코드 예제와 함께 사용 방법에 대해 상세하게 살펴보자. 데이터프레임 인덱싱이란? 판다스(Pandas) 데이터프레임(DataFrame)에서 인덱싱(indexing)은 특정 행과 열을 선택하는 것을 말한다. 데이터 프레임에서 특정 데이터에 액세스하고 조작하는 방식으로, 이를 활용하면 데이터 분석에 유용하게 사용할 수 있다. 인덱싱은 레이블 기반 인덱싱(행 및 열 레이블 사용) 또는 숫자 기반 인덱싱(행 및 열 인덱스 사용)을 사용할 수 있다. 이 두 가지 주요 방법이 loc(레이블 기반 인덱싱)과 iloc(숫자.. 2023. 2. 7. 이전 1 2 3 4 5 다음