반응형

Python/Python 기초 3

[파이썬] HTML, XML파일에서 데이터 추출하는 파이썬 라이브러리 'Beautiful Soup' 에 대해 알아보기 / 사용법

먼저 Beautiful Soup은 HTML과 XML 파일에서 데이터를 추출하는 파이썬 라이브러리입니다. HTML과 XML은 웹 사이트의 콘텐츠를 저장하는 데 사용되는 매우 일반적인 형식입니다. Beautiful Soup은 이러한 형식에서 데이터를 추출하고, 분석하고, 변환하는 데 유용합니다. Beautiful Soup은 파이썬의 표준 라이브러리로 포함되어 있지 않기 때문에, 우선 설치해야 합니다. 설치는 파이썬 패키지 관리자인 pip를 사용하여 간단히 할 수 있습니다. 다음 명령을 사용하여 설치합니다. pip install beautifulsoup4 Beautiful Soup은 HTML 및 XML 문서의 모든 요소를 객체로 나타내며, 이러한 객체를 이용하여 원하는 정보를 추출할 수 있습니다. 이러한 객체..

파이썬에서 http 다운로드를 하는 방법 Urllib.request

1. urllib 모듈 사용하기 urllib 모듈은 파이썬에서 URL을 다루는 데 사용되는 모듈입니다. 이 모듈을 사용하여 http 다운로드를 할 수 있습니다. import urllib.request url = ""http://example.com/file.zip"" filename = ""file.zip"" urllib.request.urlretrieve(url, filename) 위 코드에서는 urllib.request 모듈의 urlretrieve 함수를 사용하여 파일을 다운로드합니다. urlretrieve 함수는 첫 번째 인자로 다운로드할 파일의 URL을, 두 번째 인자로 저장할 파일의 이름을 받습니다. 2. requests 모듈 사용하기 requests 모듈은 파이썬에서 HTTP 요청을 보내는 데..

파이썬에서 특정 폴더의 파일명을 추출하여 list.txt에 저장하기

파이썬에서 현재 사용자의 데스크탑 경로를 가져오기 위해서는 os 모듈을 사용합니다. 맨 상단에 import os 라고 먼저 입력합니다. include 같은 개념으로 생각하시면 쉽습니다. 위 코드에서 os 모듈의 listdir() 함수를 사용하여 폴더 내 모든 파일명을 리스트로 가져옵니다. 그 다음, with 문을 사용하여 list.txt 파일을 쓰기 모드("w")로 열고, for 문을 사용하여 파일명을 한 줄씩 파일에 씁니다. 파일명을 쓸 때마다 줄바꿈 문자("\n")를 추가하여 각 파일명이 한 줄씩 저장되도록 합니다. listdir() 함수는 파이썬의 os 모듈에서 제공되는 함수로, 지정된 디렉토리 내의 모든 파일 및 디렉토리의 이름을 리스트로 반환합니다. 다음은 listdir() 함수를 사용하여 현재..

반응형