クラス | 説明 |
---|---|
MediawikiXmlHandler |
XML Handler for Media Wiki
|
WikiDocumentAnnotator |
Document の "wikitext" から必要な部分を切り出して "text" にセットする。
|
WikiDocumentCrawler |
Properties:
wikidumpfile: File path of wiki dump.
|
WikiDocumentCrawler2 |
文書の遅延読み込みを行う。
|
WikiDumpReader | |
WikiIndex | |
WikiIndexDocument | |
WikiIndexItem | |
WikiIndexReader |
https://dumps.wikimedia.org/jawiki/
|
WikiItemTextParser | |
WikiMain | |
WikiPage |
Wiki Page Entry
|
WikiPageNode | |
WikiUtils |
Copyright © 2021 nlp4j.org. All rights reserved.