목록자연어처리 (8)
욤미의 개발일지
[Lecture 13] Web Web Page 서버에 요청을 보내면 서버는 리소스를 사용자에게 보여줌 웹 브라우저를 통해 포맷팅 되어 화면에 나타난다. html은 xml 구조를 가진다. → F12키로 Development Tool 확인 가능 html을 가져와서 beautiful soup 등 xml parser로 해석 가능 Requests 웹페이지를 읽기 위한 라이브러리 conda install requests import requests url = '' response = requests.get(url) # GET으로 접근 print(response.status_code) # 결과 코드, 200 정상 제대로 데이터를 가져옴/ 404 웹페이지를 찾을 수 없다. / 500 웹 서버에 문제가 있다. print..
[Lecture 12] Setting & Exception & Logging Programming Setting 실행할 때 마다 필요한 설정 값 딥러닝 학습 횟수(epoch), 학습 계수(language rate), gpu 개수 → Command Line Argument(명령행 인자)로 입력하면 편리함 한번 설정하면 수정을 잘 안하는 설정 값 폴더 위치, 포트 → 설정 파일에서 불러들이기(YAML, ConfigParser) Command Line Argument 콘솔 창에서 프로그램 실행 시 프로그램에 넘겨주는 인자 값 Command-line Interface(CLI)에서 흔히 쓰는 방식 공백 기준으로 분리되며 문자열 형태로 전달 import sys, sys.argv로 접근 가능 argparser Com..
[Lecture 11] IO Python의 Input/Output JSON, YAML, txt 파일 관련 파일 입출력은 OS 에서 관장한다. Standard Input&Ouput 따로 Redirection 없으면 콘솔 입/출력 # 표준 출력(stdout) print("This", "Sentence") # This Sentence 기본적으로 띄어쓰기로 연결 print("This", "Sentence", sep=", ") # This, Sentence 구분자 변경가능 # 표준 입력(stdin) var = input() > 로 redirection 가능 pyhton test.py > output.txt python test.py < input.txt | pipeline 한 표준 출력값을 다른 입력의 표준 입력..
[Lecture 10] String 문자열 처리, 정규표현식 파이썬의 String의 특징 원시 자료형이자, 불변 타입(+= 하면 out-place연산) 큰 따옴표나 작은 따옴표로 표기 따옴표를 세 개를 연달아쓰면 여러 줄을 넣을 수 있다. “”” “”” / ‘’’’ ‘’’ indexing, slicing 가능 덧셈, 곱셈 가능 in, not in 연산 가능 ( tuple과 다소 다르게 작동) unicode로 처리 Special Characters escape 문자\를 사용해 특수 문자 작성 가능 문자 설명 \ [enter] 다음 줄과 연속임을 표현 \\ \ 문자 \’ ‘ 문자 \” “ 문자 \b 백스페이스 \n 줄 바꾸기 \t tab 키 \e esc 키 Raw string r”text” 형태로 \를 무시..
[Lecture 8] Module & Package 모듈과 패키지로 작성한 코드를 재사용할 수 있다. 파이썬에서 모듈 = .py 파일 import module 모듈을 불러올 수 있다. 해당 파일의 최상위에 선언된 모듈의 요소들을 불러올 수 있다. module.element로 사용가능 . 혹은 .. 없이는 절대 경로 기준이다.(python이 실행되는 곳) import문은 import된 .py 파일을 처음부터 끝까지 실행시킨다. 모듈로 import 했을 때 특정 Block만 실행시키고 싶다면? __name__ 기본 변수는 현재 모듈의 이름을 보여줌. main으로 실행중이면 __main__이라는 특수한 이름을 가짐 def add(num1: int, num2: int) -> int: return num1 + n..
[Lecture 7] Object-Oriented Programming 절차 지향 프로그래밍 절차를 차례대로 작성하는 것 → 절차 지향 프로그래밍 중간 과정을 수정하면 뒤에 있는 코드도 수정해야할 수도 있음. 협업 시 프로그래머의 수정 사항이 다른 프로그래머에게 큰 영향을 줌 → 코드를 객체 단위로 나눌 필요가 있다. = 객체 지향 프로그래밍 클래스(Class)당 객체(Object)는 여러개 일 수 있다. 각 객체의 데이터(Attribute)는 달라도 행동(Method)는 동일하다. Class 클래스명(부모클래스)클래스 선언 클래스명은 CamelCase가 관습적으로 사용 부모 클래스가 지정되지 않으면 object가 자동 상속된다. 클래스 속성 모든 객체가 같은 값을 참조, but 남용하면 스파게티 코드의..