본문 바로가기

웹크롤링을 이용하여 추출하여 .txt파일로 저장

ko.konene 발행일 : 2024-12-21
반응형

크롬드라이버를 헤드리스 모드로 실행하고, 현재 작업중인 내용을 시각적으로 보이도록 로그로 보여주고 실행이 완료되면 닫기버튼 활성화하여 개발

 

https://googlechromelabs.github.io/chrome-for-testing/

 

Chrome for Testing availability

chrome-headless-shellmac-arm64https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.204/mac-arm64/chrome-headless-shell-mac-arm64.zip200

googlechromelabs.github.io

#크롬드라이버를 이용하기때문에 크롬드라이버 설치

 

주소창에 복붙하여 다운로드 

 

#나중에 따로 .EXE 프로그램으로 추출해야하기때문에 파이썬프로젝트 폴더 메인에 크롬드라이버넣어두고 

from selenium import webdriver

# ChromeDriver 경로 지정
driver = webdriver.Chrome(executable_path='chromedriver의_경로')

# 웹 페이지 열기
driver.get('http://www.google.com')

# 검색어 입력 및 검색 실행
search_box = driver.find_element_by_name('q')
search_box.send_keys('ChromeDriver')
search_box.submit()

# 작업 완료 후 브라우저 종료
driver.quit()

 

이렇게 사용하면된다.

 

나중에 추후에 파이썬으로 개발을 완료하면

PyInstaller 설치

pip install pyinstaller

 

chromedriver.exe와 같은 외부 파일이 프로그램에 필요하면 스크립트와 같은 디렉토리에 배치

 

.EXE파일로 추출하는방법

pyinstaller --onefile --noconsole --add-data "chromedriver.exe;." selenium_loading.py

selenium_loading.py <- 이부분은 내가 개발한 py파일이름대체하고

powershell이나 명령프롬프트로 실행시키면된다. 

 

추출완료. 이렇게 두개가 한세트로 다녀야함.

크롬드라이버 최신이라면 크롬은 113버전 이상설치요

 

반응형

'컴퓨터 > 자작프로그램' 카테고리의 다른 글

스크린샷 프로그램 제작  (0) 2024.12.24
JLPT N4/N5 기초독해연습  (1) 2024.12.17
JLPT N5 단어장 (201~300)  (2) 2024.12.16
JLPT N5v1.0 업그레이드  (1) 2024.12.16

댓글