반응형

파이썬 스크립트 2

[파이썬] HTML, XML파일에서 데이터 추출하는 파이썬 라이브러리 'Beautiful Soup' 에 대해 알아보기 / 사용법

먼저 Beautiful Soup은 HTML과 XML 파일에서 데이터를 추출하는 파이썬 라이브러리입니다. HTML과 XML은 웹 사이트의 콘텐츠를 저장하는 데 사용되는 매우 일반적인 형식입니다. Beautiful Soup은 이러한 형식에서 데이터를 추출하고, 분석하고, 변환하는 데 유용합니다. Beautiful Soup은 파이썬의 표준 라이브러리로 포함되어 있지 않기 때문에, 우선 설치해야 합니다. 설치는 파이썬 패키지 관리자인 pip를 사용하여 간단히 할 수 있습니다. 다음 명령을 사용하여 설치합니다. pip install beautifulsoup4 Beautiful Soup은 HTML 및 XML 문서의 모든 요소를 객체로 나타내며, 이러한 객체를 이용하여 원하는 정보를 추출할 수 있습니다. 이러한 객체..

파이썬에서 http 다운로드를 하는 방법 Urllib.request

1. urllib 모듈 사용하기 urllib 모듈은 파이썬에서 URL을 다루는 데 사용되는 모듈입니다. 이 모듈을 사용하여 http 다운로드를 할 수 있습니다. import urllib.request url = ""http://example.com/file.zip"" filename = ""file.zip"" urllib.request.urlretrieve(url, filename) 위 코드에서는 urllib.request 모듈의 urlretrieve 함수를 사용하여 파일을 다운로드합니다. urlretrieve 함수는 첫 번째 인자로 다운로드할 파일의 URL을, 두 번째 인자로 저장할 파일의 이름을 받습니다. 2. requests 모듈 사용하기 requests 모듈은 파이썬에서 HTTP 요청을 보내는 데..

반응형