Dolphins의 HelloWorld
ASCII 코드 / 유니코드 아스키는 컴퓨터와 통신 장비를 비롯한 문자를 사용하는 많은 장치에서 사용되며, 대부분의 문자 인코딩이 아스키에 기반한다.-> 메모리에서 8비트를 차지한다. 파이썬에서 ord()를 사용하면 ASCII문자에 대응하는 숫자를 알 수 있다. print(ord(' ')) #결과 : 32print(ord('!')) #33print(ord('A')) #65 하지만 ASCII는 영문자 외에 다른 문자를 표현하기에는 부족하며 그래서 발전한것이 Unicode이다. 이미 Unicode는 많은 문자를 포함하고 있으며, 여전히 다른 새로운 문자를 저장할 여력이 있다. 하지만 문제는 유니코드를 네트워크를 전송할 때 용량이 과도하게 크다는 점이다. 때문에 유니코드를 압축한 UTF-8을 사용한다. (UT..
정규식 활용 공백 사이에 있는 데이터 읽기 import re data = 'Martial mat1234@gmail.com London Male' result = re.findall('\S+@\S+',data) # @전후로 공백 전까지의 문자열 저장 print(result) 원하는 부분만 출력 원하는 정보를 얻어내기 위해 뽑아낸 문자열중에 특정 부분만 활용하고자 할 때가 있다. 그럴 때 쓰는 것이 ( ) 이다. 정규식에서 소괄호를 사용하면 그 안에있는 부분만 선택적으로 추출할 수 있다. 아래의 예시를 통해 이해해보자. import re data = 'Martial mat1234@gmail.com London Male' result = re.findall('Martial\s([^ ]*)',data) prin..
정의 특정한 규칙을 가진 문자열의 집합을 표현하는데 사용하는 형식언어. 문자열 비교나 처리를 하기 용이한 와일드카드 표현식. 정규식의 규칙 ^ 라인의 처음을 매칭 $ 라인의 끝을 매칭 . 줄바꿈 문자인 '\n'을 제외하고 모든 문자와 매칭 \s 공백 문자를 매칭 \S 공백이 아닌 문자를 매칭 * 반복되는 문자를 매칭 + 한번이상 반복될 때 사용 [abc] a,b,c 중 한개의 문자와 매치 [a-z0-9] - 기호로 문자 범위 명시 ? 있어도 되고 없어도 될 때 정규식 활용 정규식을 사용하기 위해서는 먼저 re모듈을 import 해주어야 한다. dir 명령어를 써서 re를 통해 사용할 수 있는 메소드들을 출력해보면 다음과 같다. 여기에 있는 함수들 중 search는 라이브러리의 find 메소드와 같은 역할..