졸작 gcp 설치 중 애먹은 내용 ...spread
1. vm 인스턴스 설치 중 ...spread
https://minimin2.tistory.com/171
(1) 국가 설정
프리로 이용 가능한 기본 국가(미주 국가..)들, 서울 등등 여러 나라들로 많이 시도해 봤는데, 실패
-> asia-east1-c로 선택(타이완으로 선택)
(2) GPU 설정
gpu를 사용 && 프리 계정이라 시간당 부과되는 가격이 낮은 버전을 쓰기 위해
-> NVIDIA T4 선택
(3) 부팅 디스크 설정
ubuntu 사용해야 해서 기본에서 우분투로 변경
-> ubuntu-2004-focal-v20240229 선택, 크기 50GB로 변경
Ubuntu 20.04.6 LTS 설치됨
GNU/Linux 5.15.0-1052-gcp x86_64
(4) 방화벽에서 접근 허용 박스 체크
이전에 만든 vm 인스턴스에서 환경설정할 때 jupyter 창 안 뜨는 것 같길래
-> http, https 접근 시 허용 어쩌구 체크 표시함
(5) 방화벽 규칙
주피터 사용할거라
-> 대상 태그에 jupyter 추가
--------
2. 1단계에서 체크 못 하고 만든 부분
(1) 부팅 디스크 유형 변경
부팅 디스크 이미지 설정에서 부팅 디스크 유형을 '표준 영구 디스크'로 변경해야 하는데 못 함 (프리 계정이면 변경하는게 안전한 듯. 금액 마니 부과되는 거 막으려면)
(2) 방화벽 규칙 설정
규칙 자세히 설정 못 함
--------
3. 계속 하면서 해결한 내용
(1) 주피터 사이트 안 뜨는 거
vm 인스턴스 만들 때 방화벽 내용 체크
(2) GPU 드라이버 설치
GPU 드라이버 설치하는 과정에서
ubuntu-drivers devices
명령어를 터미널에 입력하면 계속
e: unable to locate package ubuntu-drivers-common
에러 메세지가 뜸
-> vm 인스턴스를 만들 때 부팅 디스크 단계에서 우분투로 변경해야 했는데, 안 하고 기본 설정인 리눅스로 계속 가서 생기는 문제
-> vm 인스턴스 새로 만들면서 우분투로 부팅 디스크 변경하니 해결됨
(3) CUDA 설치 시 toolkit 설치 시 발생한 문제들
처음에 sudo sh ~.run --silent --toolkit 명령어를 입력하면 자꾸 아무 것도 뜨지 않고 검정 화면에서 멈추는(?) 이슈 발생함
-> 설치가 안된건가 싶어 ls, cd 명령어 이용해 디렉토리 전부 뒤짐
-> cuda_11.2.0 ... .linux.run이라는 파일이 여러 번 시도 끝에 여러 개나 설치된 거 발견
-> 근데 cuda-11.2 디렉토리는 발견 X
-> cuda path 설정 시 잘못한 건가 싶어 구글링 ing..
-> 구글링 중, 본인에게 맞는 버전을 설치해야 한다는 내용 발견
참고 주소 :
https://velog.io/@boom109/nvidia-driver-cuda-toolkit-cudnn-install
https://jimmy-ai.tistory.com/392
-> 기존 드라이버와 설치할 드라이버 간의 충돌 이슈가 있다는 내용 보고 기존 드라이버 삭제
-> cuda를 12.2 버전으로, 우분투를 recommended인 535 버전으로 다시 설치 진행함
-> 새로 설치한 버전에 맞게 cuda path 설정 변경
-> sudo sh ~.run --silent --toolkit 명령어 입력하고 기다리니 Base Installer 창 뜸..!!! 대바아악
-> 기존 드라이버를 삭제해서 드라이버까지 선택하고 Install 눌렀는데 설치 안 됨
-> 이번엔 드라이버 선택 안 하고 Install 함
-> 설치 잘 됨 (엥 왜 됨)
-> nvcc -V 명령어 입력하니 CUDA가 올바르게 설치되었다는 결과 출력 확인
...되다..ㅎ ciang
--------
4. 느낀 점
설정 한 단계 나아갈 때마다 에러 뜨고 안 돼서 기본 vm 인스턴스 생성 단계만 수없이 하면서 엄청 킹받았었음
그래도 '해야 하니까.. 응 졸업은 해야지..'
라는 심정으로 에러 메세지 하나 하나 구글링 해가며 시간 쏟았더니 한 단계씩 가능해지면서 성취감? 자신감?까지는 오바고 ㅋㅋ
암튼 아직 ing 이긴 한데 그래도 조금씩 해결되는 모습을 보니 '되겠다, 할 수 있겠다'라는 생각이 드는 듯
누가 뭐래도 화이팅이다 나 자신아
--------
2024/03/16 다시 수정..
지난번에 cuda toolkit 설치까지 진행했는데,
cuDNN 설치에서 막힘
cuDNN 설치에서부터 다시 진행
https://donghyun99.tistory.com/18
-> nvidia 535 / cuda 12.2 이라
구글링해보니 cuDNN은 v8.9.5를 Local Installer for Linux x86_64 (Tar)로 다운받는 게 맞는 것 같아서 그대로 진행함
-------
주피터 여는 법
ssh창에서
jupyter-notebook --ip=0.0.0.0 --port=8888
입력하고
크롬에
http://외부IP주소:8888
입력하고 이동한 후 ssh창에 뜨는 토큰 복붙에서 주피터창의 토큰 칸에 입력하기
Name: tensorflow
Version: 2.13.1
Summary: TensorFlow is an open source machine learning framework for everyone.
Home-page: https://www.tensorflow.org/
Author: Google Inc.
Author-email: packages@tensorflow.org
License: Apache 2.0
Location: /home/lin19990902/.local/lib/python3.8/site-packages
https://seongkyun.github.io/others/2019/01/02/ubuntu_settings/