중화사전망 - 자전 검색 - Lxml.etree
Lxml.etree
인쇄:
특수 상황 (생략 가능):
일반적으로 같은 요소는 한 곳에만 존재할 수 있습니다 (원래 요소 트리 API 와는 다름).
원래 요소 트리에서 단일 요소 객체는 원하는 수의 트리 내 원하는 수의 위치에 있을 수 있으므로 목록과 동일한 복사 작업을 수행할 수 있습니다. 분명한 단점은 이러한 요소에 대한 변경 사항이 트리에 나타나는 모든 곳에 적용된다는 것입니다. 이는 의도적이거나 의도적이지 않을 수 있습니다.
이러한 차이의 장점은 lxml.etree 의 요소에 항상 부모 요소가 하나뿐이며 getparent () 메서드를 통해 쿼리할 수 있다는 것입니다. 원래 요소 트리에서는 지원되지 않습니다.
요소를 lxml.etree 의 다른 위치에 복사하려면 Python 표준 라이브러리의 복사 모듈을 사용하여 from copy import deepcopy 라는 독립적인 깊이 사본을 작성하는 것이 좋습니다.
요소의 Attrib 멤버는 사전 인터페이스를 완벽하게 지원합니다.
Attrib 멤버에 대한 변경 사항은 원래 요소에 적용되고 그 반대의 경우도 마찬가지입니다. Dict(root.attrib) 를 사용하여 별도의 사전을 얻을 수 있습니다.
데이터 기반 XML 은 일반적으로 리프 노드에만 텍스트를 포함하지만 하이퍼텍스트 문서에서는 요소 사이에 텍스트가 나타날 수 있습니다.
이는 꼬리 구성원이 지원할 수 있습니다 (건너뛸 수 있음).
주의하세요. 텍스트 멤버에는 요소 하위 텍스트의 시작 부분만 포함됩니다. Tail 멤버는 요소 바로 뒤에 오는 텍스트를 포함합니다.
Tostring 을 사용하여 XML 에 포함된 모든 텍스트를 추출할 수 있습니다.
을 눌러 섹션을 인쇄할 수도 있습니다. 요소의 iiter 메서드는 문서 트리 순서의 반복자를 생성합니다 (직접 반복 요소 자체와는 다름).
Iter 메서드에 태그를 지정하면 지정된 요소만 반복됩니다.
ElementTree 클래스에는 DOCTYPE 및 DTD 와 같은 전체 문서 정보가 들어 있습니다.
ElementTree 는 parse () 함수를 사용하여 파일 반환 값을 구문 분석하는 유형입니다.
직렬화 시 ElementTree 와 해당 루트 노드 간의 차이점을 확인합니다.
Fromstring 함수는 XML 문자열을 XML 요소로 구문 분석합니다. 반환 값 유형은 etree 와 같은 lxml.etree._Element 클래스입니다. 요소) 를 참조하십시오.
XML 함수는 기본적으로 fromstring 과 동일하게 동작하며 Element 클래스를 반환합니다.
HTML 및 body 요소 (원래 문자열이 없는 경우) 를 자동으로 추가하는 html 함수도 있습니다 (element 클래스도 반환됨).
주: HTML 함수의 반환 값은 여전히 표준 XML 로 간주됩니다.
Parse 함수는 주로 전체 문서를 구문 분석하는 데 사용되고 위에서 언급한 문자열 구문 분석 함수는 주로 문서 조각을 구문 분석하는 데 사용됩니다.
참고: parse 함수는 Element 객체가 아닌 ElementTree 객체를 반환합니다.
Parse 함수는 다음 인수를 지원합니다.
일반적으로 파일 이름이나 URL 에서 구문 분석하는 것이 파일 객체에서 구문 분석하는 것보다 빠릅니다.
아직, 원본 링크를 봐.
아직, 원본 링크를 봐.
Lxml.etree 는 단계별 증분 분석을 위한 두 가지 방법을 제공합니다. 하나는 read () 메서드를 반복적으로 호출하는 유사한 파일을 통과하는 객체입니다. 두 번째 방법은 feed(data) 및 close () 메서드에서 제공하는 feed 파서 인터페이스를 사용하는 것입니다.
아직, 원본 링크를 봐.
필요한 문서가 트리 깊이의 일부에 불과하기 때문에 전체 트리를 메모리로 구문 분석하고 트래버스한 다음 폐기하는 데 많은 오버헤드가 발생할 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 예술명언) Lxml.etree 는 두 개의 이벤트 중심 분석기 인터페이스를 통해 이 사용 사례를 지원합니다.
아직, 원본 링크를 봐.
아직, 원본 링크를 봐.
E-factory 는 XML 및 HTML 생성을 위한 간단하고 간결한 구문을 제공합니다. 속성 기반 액세스를 기반으로 요소를 만들면 XML 언어에 대한 간단한 용어집을 쉽게 만들 수 있습니다.
아직, 원본 링크를 봐.
ElementTree 라이브러리에는 ElementPath 라는 간단한 XPath 같은 경로 언어가 함께 제공됩니다. API 는 요소 및 요소 트리에서 찾을 수 있는 네 가지 방법을 제공합니다.