반응형

데이터파싱 4

[python] 크롤링하고 마크업 언어 파싱하는 BeautifulSoup 모듈 사용법

먼저, BeautifulSoup 모듈을 사용하기 위해서는 bs4 라이브러리를 설치해야 합니다. bs4 라이브러리는 pip 명령어를 사용하여 설치할 수 있습니다. pip install bs4 BeautifulSoup 모듈은 HTML, XML 등의 마크업 언어를 파싱하는 데 사용됩니다. BeautifulSoup 객체를 생성하고, 원하는 데이터를 추출하는 방법은 다음과 같습니다. from bs4 import BeautifulSoup # HTML 코드를 파싱합니다. html = "ExampleSome text." soup = BeautifulSoup(html, "html.parser") # 태그를 이용하여 데이터를 추출합니다. title = soup.h1.text text = soup.p.text # 추출한 데..

[python] 데이터 파싱이란 무엇인가?

이 코드는 requests 라이브러리를 사용하여 https://www.example.com 웹 페이지의 HTML 코드를 가져옵니다. 그리고 BeautifulSoup 라이브러리를 사용하여 HTML 코드를 파싱합니다. title 변수에는 웹 페이지의 타이틀을 저장하고, links 변수에는 웹 페이지의 모든 링크를 리스트로 저장합니다. soup.find_all("a")는 HTML 코드에서 모든 태그를 찾아서 리스트로 반환합니다. link.get("href")는 태그에서 href 속성의 값을 가져옵니다. 데이터 파싱은 데이터를 분석하고 원하는 정보를 추출하는 과정을 말합니다. 예를 들어, 웹 페이지에서 특정한 정보를 추출하거나, 로그 파일에서 특정한 이벤트를 추출하는 등의 작업이 데이터 파싱에 해당합니다. 데이..

[python] json 모듈로 데이터 파싱하기 - 2번째

import json json_string = ''' { "name": "John", "age": 30, "city": "New York", "pets": [ { "name": "Fluffy", "species": "cat" }, { "name": "Fido", "species": "dog" } ] } ''' python_obj = json.loads(json_string) print(python_obj["name"]) # 출력 결과: John print(python_obj["pets"][0]["name"]) # 출력 결과: Fluffy json.loads() 함수는 JSON 문자열을 파이썬 객체로 변환합니다. 이 예시에서는 파이썬 딕셔너리를 반환합니다. pets 키의 값은 파이썬 리스트이며, 각 항목은..

[python] json모듈로 데이터 파싱하기

JSON 파싱은 파이썬에서 매우 쉽습니다. json 모듈을 사용하여 JSON 문자열을 파이썬 객체로 변환할 수 있습니다. 예를 들어, 다음과 같은 JSON 문자열이 있다고 가정해 봅시다. { "name": "John", "age": 30, "city": "New York" } 이 JSON 문자열을 파이썬 객체로 변환하려면 다음과 같이 코드를 작성할 수 있습니다. import json json_string = '{"name": "John", "age": 30, "city": "New York"}' python_obj = json.loads(json_string) print(python_obj["name"]) # 출력 결과: John json.loads() 함수는 JSON 문자열을 파이썬 객체로 변환합니다...

반응형