728x90
반응형
데이터를 크롤링을 하기 위해서는 작업환경을 가상환경으로 설정해야 웹에 접근하여 크롤링을 할 수있습니다.
물론 python으로도 데이터 크롤링을 할 수는 있으나, pip하나만을 포함하고 있어 필요한 모듈을 수동으로 하나하나 다운 받으셔야 합니다.
그렇게 하기 귀찮고 나중에 모듈이 뭐가 필요한지 검색하는 시간로스가 생기니까, 우리는 anaconda를 사용하여 데이터 분석을 진행 할 것입니다.

아마 여러분들이 anconda를 통해 python을 다운 받으셨다면, 아래와 같은 프로그램이 있을 겁니다.

이제 이 프로그램에 들어가서, 쥬피터 노트북 다운로드와, 쥬피터 랩을 다운로드 후 ,가상환경 생성을 합니다.


Environments > Create(하단 아이콘) > 가상환경 이름
python 버전 확인해주세요
이제 가상환경을 생성하고나서(시간이 조금 걸립니다.)
그럼 이 시간을 틈타
주피터 랩(Jupyter lab)
- Jupyter lab은 2018년 출시되었고, Jupyter Notebook 보다 더 발전된 버전이다.
- 주피터 랩은 대화형 컴퓨팅을 지원하여 코드를 실행하고 결과를 즉시 확인할 수 있다.
- 다양한 플러그인과 확장 기능을 제공하여 사용자 정의 작업환경을 구성할 수 있다.
- 데이터 분석 및 시각화 작업에 탁월하며 문서화 하여 저장하고 공유할 수 있다.
이제 생성되셔쬬 :D 이제 가상환경을 사용하시려면 쥬피터 랩을 실행하신 후 가상환경 파일로 들어가시 면 됩니다.
가상환경과 글로벌 환경에 차이는 다음과 같습니다.

가상환경이 필요한 이유
- 프로젝트를 진행하다 보면 여러 library, package를 다운로드 하게 됨.
- 각 library, package들끼리 충돌을 일으키는 경우가 증각한다.
- 이런 경우에 가상환경을 이용한다면?
- 프로젝트별로 독립적인 작업 환경에서 작업할 수 있다!
만들어 놓고 관리를 안하면 그냥 용량만 잡아 먹는 프로그램이 되겠죠?
관리하는 방법을 알아 봅시다.
가상환경관리
- Anaconda Prompt 실행 (시작에서 검색하여 실행)
- 가상환경 조회 - conda env list

- 위 base 아래에 가상환경이 생성되어 있다면 제대로 생성 된 것입니다.
- 만약 더 생성하고 싶으시다면
- conda create -n(가상환경이름) python = [버전]
- 가상환경 활성화 - 생성한 폴더로 이동한 후
- conda activate (가상환경 명)
- pip install ipykernel : 주피터 랩 또는 주피터 노트북과 같은 인터페스에서 사용할 수 있는 커널
- python -m ipykernel install --user --name 이름 : 주피터랩 또는 주피터 노트북에서 작업할 때, 해당 가상환경을 선택할 수 있도록 추가

이제 주피터 랩을 실행 해봐야 겠죠

다음과 같이 입력해주면

짜잔 여기서 가상환경 notebook으로 들어가시면 됩니다. 작동은 파이썬이랑 같으니 쓰는 것에는 문제가 없을 것입니다.
그럼 오늘은 여기까지 입니다.
오늘도 같이 공부하시느라 수고 많으셨습니다!!!!!!

반응형
'데이터 가져오기' 카테고리의 다른 글
| Python 데이터 beautifulsoup (1) | 2024.12.12 |
|---|---|
| 데이터 CSS (0) | 2024.12.10 |
| [데이터] 데이터 수집과 웹 기초 (2) (3) | 2024.12.09 |
| [데이터] 데이터 수집과 웹 기초 (1) (1) | 2024.12.07 |