중화사전망 - 자전 검색 - Python3 정규식은 중국어 흐림 일치 대체 및 출력을 어떻게 구현합니까?
Python3 정규식은 중국어 흐림 일치 대체 및 출력을 어떻게 구현합니까?
희토류를 수입하다
# 대체 작업을 구현하는 함수를 정의합니다.
대체 패턴 정의 (개체 일치):
돌아와서 "먹고 싶어"
# 파일 내용 읽기
Open ("input.txt", "r", encoding = "utf-8") 을 파일로 사용:
Content = file.read ()
# 정규 표현식을 사용한 퍼지 일치 대체
패턴 = r "대나무 (? : a | 330) (? : 30 | 1)
Replaced _ content = re.sub (모드, replace _ 모드, 내용)
# 대체된 내용을 새 파일에 씁니다
Open ("output.txt", "w", encoding = "utf-8") 을 파일로 사용:
File.write (내용 바꾸기)
이 예에서 정규식 r "bamboo (? : a | 330) (? : | a) "제모선" 이나 "제모선" 과 함께 사용한다. (? : ...) 비캡처 그룹입니다. 즉, 모든 문자가 일치하지만 캡처되지 않습니다. 이 그룹에는 각각 "a" 와 "Chan" 이 포함되므로 "Zhu Chan" 이나 "Zhu Chan" 과 함께 사용할 수 있습니다. 다음으로 일치하는 문자열을 re.sub 함수로 바꿉니다. 여기서는 "Bamboo chan chan" 을 직접 반환하는 대체 함수인 replace_pattern 을 제공합니다. 마지막으로 대체된 내용을 output.txt 라는 새 파일에 씁니다
...... ......
회신:
특정 중국어 문자를 일치시키려면 유니코드의 중국어 문자 범위를 사용할 수 있습니다. 다음은 수정된 예제 코드입니다. "Zhu Chanmou" 또는 "Zhu Chanmou" 를 "Zhu chan chan" 으로 바꿀 수 있습니다. 여기서 "a" 는 임의 한자입니다.
희토류를 수입하다
# 대체 작업을 구현하는 함수를 정의합니다.
대체 패턴 정의 (개체 일치):
돌아와서 "먹고 싶어"
# 파일 내용 읽기
Open ("input.txt", "r", encoding = "utf-8") 을 파일로 사용:
Content = file.read ()
# 정규 표현식을 사용한 퍼지 일치 대체
Pattern = r "bamboo [\u4e00-\u9fa5] 방향타 [\ u4e00-\ u9fa5]
Replaced _ content = re.sub (모드, replace _ 모드, 내용)
# 대체된 내용을 새 파일에 씁니다
Open ("output.txt", "w", encoding = "utf-8") 을 파일로 사용:
File.write (내용 바꾸기)
이 예에서 정규식 r "Zhu [\ u4e00-\ u9fa5] chan | Zhu Chan [\ u4e00-\ u9fa5]" 는 "Zhu Chan" 또는 [u4e00-\ u9fa5] 모든 중국어 문자를 일치시키는 데 사용됩니다. 다음으로 일치하는 문자열을 re.sub 함수로 바꿉니다. 여기서는 "Bamboo chan chan" 을 직접 반환하는 대체 함수인 replace_pattern 을 제공합니다. 마지막으로 대체된 내용을 output.txt 라는 새 파일에 씁니다