반응형
[Python] beautifulSoup 사용 시 a태그에서 href 추출하는 방법 !!
크롤링 사용시 beautifulSoup으로 html 소스 가져오고 그 중 a 태그에서 href 속성 추출하는 방법 입니다.
아래 예제코드보시고 응용해서 사용하시면 됩니다 :)
(아래코드는 샐레니움 셋팅이 되어있다고 가정하고 작성하였습니다.)
예제코드
html = driver.page_source # 현재 페이지의 소스코드를 가져옵니다.
soup = BeautifulSoup(html, 'html.parser') # BeautifulSoup 객체로 변환
dataList = soup.find_all("a")
for i,data in enumerate(dataList):
hrefLink = i.attrs['href']
print(i, '번째 == ', hrefLink)
728x90
반응형
'Coding > Python' 카테고리의 다른 글
[Python] pandas 사용하여 엑셀에 입력 된 데이터 글자수 체크하는 방법 !! (0) | 2023.09.26 |
---|---|
[Python] pandas 사용하여 엑셀 각각의 열을 연속적으로 복사하는 방법 !! (0) | 2023.09.23 |
[Python & SQLAlchemy] orm을 사용하여 가장 최근 데이터 호출 하는 방법 !! (마지막 데이터 구하기) (0) | 2023.09.18 |
[Python & FastAPI] 맥os에서 uvicorn 명령어 에러 해결 방법 !! (macOS - command not found: uvicorn) (0) | 2023.09.01 |
[Python & Flask] nohup을 이용하여 Flask 안꺼지고 백그라운드로 실행하는 방법 !! (0) | 2023.08.03 |
댓글