すべてのクラス
-
すべてのクラス インタフェースの概要 クラスの概要 例外の概要 クラス 説明 AbstractCrawler データクローラーの抽象クラス
Abstract class for data crawlerAbstractDocumentAnnotator ドキュメントアノテーターの抽象クラス。AbstractDocumentImporter 文書をインデックスにインポートするドキュメントインポーターの抽象クラスです。AbstractDocumentImporter 文書をインデックスにインポートするドキュメントインポーターの抽象クラスです。AbstractDocumentIndexer AbstractIndexerAbstractDocumentSearcher AbstractFileCrawler ファイルクローラーの抽象クラス
Abstract File CrawlerAbstractSearchClient AbstractXmlHandler XMLハンドラーの抽象クラスです。AttributeCopyAnnotator 属性をコピーする
プロパティ
from コピー元
to コピー先AttributeFilterAnnotator AttributeNameConverter 属性名を変換する
プロパティ
mapping "変換前1->変換後1,変換前2->変換後2"AttributeRemoveAnnotator 属性を削除する
プロパティ
target 処理対象AttributeReplaceAllAnnotator 属性を置換する
プロパティ
target 処理対象フィールド
regex 置換前文字列の正規表現
replacement 置換後の文字列AttributeTypeConverter 属性のタイプを変換する
プロパティ
mapping "field_name->Type,field_name->Type,field_name->Type"
Example
mapping date->Date:yyyyMMdd,field_int1->Integer,field_int2->IntegerCharacterUtils CompoundAnnotator 複合名詞のアノテーションを処理する。ConsoleUtils Utilities for Command Line InterfaceCount<T> Counter<T> created_at : 2021-07-13Crawler データクローラーのインターフェイスクラスです。CsvFileCrawler CSVファイルをクロールします。CsvOutImporter Output CSV fileDateAttributeConvertAnnotator 文字列形式の日付を java.util.Date に変換する
プロパティ
target: 対象のフィールド
format: SimpleDateFormat形式DateDiffAnnotator 日付の差分を計算して追加する
プロパティ
target1 日付1(過去)のフィールド
target2 日付2(未来)のフィールド
target 日付2 - 日付1 をセットするフィールドDateUtils DebugAnnotator DebugImporter Importer for DebuggingDefaultDocument 自然言語処理対象のドキュメントクラスです。DefaultDocumentAnnotator 自然言語データに対して情報を付加するドキュメントアノテーターです。DefaultDocumentAnnotatorPipeline ドキュメントに対してアノテーター処理を連続的に処理するパイプラインのクラスです。DefaultDocumentAnnotatorPipelineRunnable Runnable 対応版DefaultDocumentImporter ドキュメントをインデックスにインポートするクラスです。DefaultEnv デフォルトで利用できるAPP IDです。DefaultKeyword ドキュメントのキーワードとなるクラスです。DefaultKeywordWithDependency 係り受けの関係を持つキーワードのクラスです。DefaultNlpServiceResponse 自然言語処理サービスのレスポンスです。DefaultResponse DependencyAnnotator Document ドキュメントクラスです。DocumentAnnotator ドキュメントにメタ情報を付加するアノテーターです。DocumentAnnotatorPipeline ドキュメントアノテーターのパイプライン処理。DocumentBuilder created_at 2021-11-16DocumentCounter DocumentCounterBuilder DocumentCrawler ドキュメントクローラー。DocumentImporter ドキュメントインポーターのインターフェイスクラスです。DocumentIndexer ドキュメントのインデックスです。DocumentProcessor Crawl, Annotate, Import Documents.DocumentSearcher DocumentUtil DocumentUtil EmojiAnnotator EmptyAnnotator EnvUtil FacetUtils created_at : 2022-01-16FieldAnnotator フィールドを処理対象とするAnnotatorHttpClient HTTPクライアントのクラスです。InvalidPropertyException JsonLineSeparatedCrawler 改行区切りJSONのクローラー
Crawler for Line Separated JSONJsonOutImporter Output CSV fileJsonUtils Keyword キーワード
Keywords are usually words and phrases that are extracted from textual content.KeywordAnnotator キーワードを処理対象とするAnnotatorKeywordFacetFilteringAnnotator キーワードをファセットでフィルタリングする
プロパティ
filter カンマ区切りの複数ファセットKeywordFacetMappingAnnotator ファセット名を変換する
reference: Stanford CoreNLP POSタグまとめ https://qiita.com/syunyo/items/2c1ce1d765f46a5c1d72KeywordFixAnnotator 正規形がアスタリスクになっているのを修正するKeywordFormatter キーワードのクラスを文字列としてフォーマットするクラスです。KeywordHandler KeywordRule KeywordSequencePatternAnnotator 語の並びに対してパターンマッチを適用する
Pattern Annotator for Keyword Sequence (語の並び)KeywordUtil KeywordUtil.Builder<T extends Keyword> KeywordWithDependency 係り受けの依存関係をセットできるキーワードです。LexTextAnnotator 属性をコピーする
プロパティ
from コピー元
to コピー先MathUtil Nlp4JRuntimeException 実行時例外。NlpCLI NlpService NLPサービス
NLP Service Interface.NlpServiceResponse 自然言語処理の結果.Node<T> NodeKeyword<T extends KeywordWithDependency> NodeMatcher NodePrinter Node printer utilityNodeUtils Nokku34Annotator 「名詞の名詞」を「word_nn_no_nn」キーワードとして抽出します。NumeralAnnotator Annotator for Numeral (数詞)
名詞のファセットキーワードのうち、数字のみのキーワードのファセットを数詞とする
例:
{lex:"103",facet:"名詞"}→{lex:"103",facet:"数詞"}ObjectUtils ParseIntAnnotator 指定したフィールドを整数に変換するPattern PatternMatcher PatternReader created_at: 2021-05-03PlainTextOutImporter Output Plain text fileRegexUtils Response RuntimeUtils SAXParserUtils SearchClient Search ClientSearchClientBuilder<B extends SearchClientBuilder<B>> SimpleDocumentIndex シンプルなドキュメントインデックスのクラスです。StandardPatternAnnotatorJa created_at: 2022-05-12StringUtils created_at 2021-07-24TextFileCrawler テキストファイルをクロールします。TextFileLineSeparatedCrawler テキストファイルを改行区切りでクロールします。TextFileUtils UPOS20 UserPatternAnnotator created_at 2021-05-05UserPatternHandler Parse Patterns from Pattern XMLValueNormalizeAnnotator Normailze document value with Unicode NFKCWakachiAnnotator 日本語を分かち書きにするアノテーター
事前にキーワードをセットしておくことXmlUtils XML用ユーティリティのクラスです。XPathUtil