반응형

전체 글 132

[python] 크롤링하고 마크업 언어 파싱하는 BeautifulSoup 모듈 사용법

먼저, BeautifulSoup 모듈을 사용하기 위해서는 bs4 라이브러리를 설치해야 합니다. bs4 라이브러리는 pip 명령어를 사용하여 설치할 수 있습니다. pip install bs4 BeautifulSoup 모듈은 HTML, XML 등의 마크업 언어를 파싱하는 데 사용됩니다. BeautifulSoup 객체를 생성하고, 원하는 데이터를 추출하는 방법은 다음과 같습니다. from bs4 import BeautifulSoup # HTML 코드를 파싱합니다. html = "ExampleSome text." soup = BeautifulSoup(html, "html.parser") # 태그를 이용하여 데이터를 추출합니다. title = soup.h1.text text = soup.p.text # 추출한 데..

[python] 데이터 파싱이란 무엇인가?

이 코드는 requests 라이브러리를 사용하여 https://www.example.com 웹 페이지의 HTML 코드를 가져옵니다. 그리고 BeautifulSoup 라이브러리를 사용하여 HTML 코드를 파싱합니다. title 변수에는 웹 페이지의 타이틀을 저장하고, links 변수에는 웹 페이지의 모든 링크를 리스트로 저장합니다. soup.find_all("a")는 HTML 코드에서 모든 태그를 찾아서 리스트로 반환합니다. link.get("href")는 태그에서 href 속성의 값을 가져옵니다. 데이터 파싱은 데이터를 분석하고 원하는 정보를 추출하는 과정을 말합니다. 예를 들어, 웹 페이지에서 특정한 정보를 추출하거나, 로그 파일에서 특정한 이벤트를 추출하는 등의 작업이 데이터 파싱에 해당합니다. 데이..

[python] 딕셔너리란 무엇인가 ( 데이터타입 이해하기 )

딕셔너리는 파이썬에서 가장 많이 사용되는 데이터 타입 중 하나입니다. 딕셔너리는 키(key)와 값(value)으로 이루어진 쌍(pair)들의 집합입니다. 각각의 키는 유일(unique)하며, 값은 중복될 수 있습니다. 딕셔너리는 중괄호({})를 사용하여 생성하며, 각각의 키와 값은 콜론(:)으로 구분합니다. 예를 들어, 다음과 같은 딕셔너리를 생성할 수 있습니다. 이 딕셔너리는 name, age, city라는 세 개의 키를 가지고 있으며, 각각의 값은 "John", 30, "New York"입니다. 딕셔너리의 각 항목은 쉼표(,)로 구분합니다. 딕셔너리의 항목에 접근하려면, 해당 항목의 키를 사용하여 인덱싱합니다. 예를 들어, my_dict["name"]은 "John"을 반환합니다. 딕셔너리에 존재하지 ..

[python] json 모듈로 데이터 파싱하기 - 2번째

import json json_string = ''' { "name": "John", "age": 30, "city": "New York", "pets": [ { "name": "Fluffy", "species": "cat" }, { "name": "Fido", "species": "dog" } ] } ''' python_obj = json.loads(json_string) print(python_obj["name"]) # 출력 결과: John print(python_obj["pets"][0]["name"]) # 출력 결과: Fluffy json.loads() 함수는 JSON 문자열을 파이썬 객체로 변환합니다. 이 예시에서는 파이썬 딕셔너리를 반환합니다. pets 키의 값은 파이썬 리스트이며, 각 항목은..

[python] json모듈로 데이터 파싱하기

JSON 파싱은 파이썬에서 매우 쉽습니다. json 모듈을 사용하여 JSON 문자열을 파이썬 객체로 변환할 수 있습니다. 예를 들어, 다음과 같은 JSON 문자열이 있다고 가정해 봅시다. { "name": "John", "age": 30, "city": "New York" } 이 JSON 문자열을 파이썬 객체로 변환하려면 다음과 같이 코드를 작성할 수 있습니다. import json json_string = '{"name": "John", "age": 30, "city": "New York"}' python_obj = json.loads(json_string) print(python_obj["name"]) # 출력 결과: John json.loads() 함수는 JSON 문자열을 파이썬 객체로 변환합니다...

[python] self 매개변수 self.xxx __init__(self) 이해하기

self는 파이썬에서 클래스의 인스턴스를 참조하는 데 사용되는 특별한 매개변수입니다. 클래스의 메서드에서는 첫 번째 매개변수로 self를 사용해야 합니다. self 매개변수는 클래스의 인스턴스를 참조하기 위해 사용됩니다. 클래스의 인스턴스를 생성하면, self 매개변수는 해당 인스턴스를 참조하게 됩니다. 이를 통해 클래스의 메서드에서 인스턴스 변수에 접근하거나, 다른 메서드를 호출할 수 있습니다. 예를 들어, 다음과 같이 Person 클래스를 정의하고, __init__() 메서드에서 self 매개변수를 사용하여 인스턴스 변수 name과 age를 초기화할 수 있습니다. class Person: def __init__(self, name, age): self.name = name self.age = age ..

[python] __init__()메서드란 무엇인가 확실하게 알고 쓰자! 있고 없고 차이점

__init__() 메서드는 클래스의 인스턴스가 생성될 때 자동으로 호출되는 특별한 메서드입니다. 이 메서드를 사용하여 인스턴스 변수를 초기화할 수 있습니다. 당연히 클래스를 정의하지 않고 __init__() 메서드만 사용한다면, __init__() 메서드는 단순히 함수로서 동작하게 됩니다. 클래스가 없으므로, self 매개변수를 사용할 수 없으며, 인스턴스 변수를 정의할 수도 없습니다. 예를 들어, 다음과 같이 Person 클래스를 정의하고, __init__() 메서드를 사용하여 인스턴스 변수 name과 age를 초기화할 수 있습니다. class Person: def __init__(self, name, age): self.name = name self.age = age person1 = Person(..

[python] 파이썬에서 API를 사용하기 위한 첫번째 작업 ( requests 모듈)

requests는 Python에서 HTTP 요청을 보내는 데 사용되는 인기 있는 라이브러리입니다. requests를 사용하면 간단하게 HTTP 요청을 보내고, 응답을 받아올 수 있습니다. requests 라이브러리를 사용하려면, 먼저 import requests 문을 사용하여 라이브러리를 불러와야 합니다. 그리고 requests 모듈의 함수를 사용하여 HTTP 요청을 보내고, 응답을 받아올 수 있습니다. 예를 들어, 다음과 같이 requests 라이브러리를 사용하여 https://www.google.com에 GET 요청을 보내고, 응답을 출력하는 코드를 작성할 수 있습니다. import requests url = "https://www.google.com" response = requests.get(ur..

[python] 데이터 입력 받기 input()함수 사용법

파이썬에서 데이터를 입력받을 때는 input() 함수를 사용합니다. input() 함수는 사용자로부터 입력을 받아 문자열로 반환합니다. 예를 들어, 다음과 같이 input() 함수를 사용하여 사용자로부터 이름을 입력받을 수 있습니다. name = input("이름을 입력하세요: ") print(f"안녕하세요, {name}님!") 위 코드는 input() 함수를 사용하여 사용자로부터 이름을 입력받고, 이를 name 변수에 저장합니다. 그리고 f-string을 사용하여 입력받은 이름을 포함한 인사말을 출력합니다. [python] f-sting 다양하게 활용하는 예시 ( 문자열 포맷팅, 리스트, 딕셔너리) age = 25 print(f"My name is {name} and I am {age} years ol..

[python] 현재시간을 알려주는 time.localtime()함수 활용해서 ( 시,분,월 ) 찾기

import time은 시간과 관련된 기능을 제공하는 Python의 내장 모듈입니다. 이 모듈을 사용하여 현재 시간을 알아낼 수 있습니다. time.time() 함수는 1970년 1월 1일 자정 이후로 경과한 시간을 초 단위로 반환합니다. 이 값을 time.localtime() 함수에 전달하면 현재 시간을 나타내는 구조체를 반환합니다. 이 구조체에서 시간, 분, 초 등의 정보를 추출하여 사용할 수 있습니다. 예를 들어, 다음과 같이 time 모듈을 사용하여 현재 시간을 출력할 수 있습니다. import time # 현재 시간 출력 current_time = time.localtime(time.time()) print(f"현재 시간: {current_time.tm_hour}시 {current_time.tm..

반응형