パッケージ nlp4j.annotator
NLP4J のAnnotatorパッケージ
package for Annotator
package for Annotator
-
インタフェースの概要 インタフェース 説明 DependencyAnnotator -
クラスの概要 クラス 説明 AttributeCopyAnnotator 属性をコピーする
プロパティ
from コピー元
to コピー先AttributeFilterAnnotator AttributeNameConverter 属性名を変換する
プロパティ
mapping "変換前1->変換後1,変換前2->変換後2"AttributeRemoveAnnotator 属性を削除する
プロパティ
target 処理対象AttributeReplaceAllAnnotator 属性を置換する
プロパティ
target 処理対象フィールド
regex 置換前文字列の正規表現
replacement 置換後の文字列AttributeTypeConverter 属性のタイプを変換する
プロパティ
mapping "field_name->Type,field_name->Type,field_name->Type"
Example
mapping date->Date:yyyyMMdd,field_int1->Integer,field_int2->IntegerCompoundAnnotator 複合名詞のアノテーションを処理する。DateAttributeConvertAnnotator 文字列形式の日付を java.util.Date に変換する
プロパティ
target: 対象のフィールド
format: SimpleDateFormat形式DateDiffAnnotator 日付の差分を計算して追加する
プロパティ
target1 日付1(過去)のフィールド
target2 日付2(未来)のフィールド
target 日付2 - 日付1 をセットするフィールドDebugAnnotator EmojiAnnotator EmptyAnnotator KeywordFacetFilteringAnnotator キーワードをファセットでフィルタリングする
プロパティ
filter カンマ区切りの複数ファセットKeywordFacetMappingAnnotator ファセット名を変換する
reference: Stanford CoreNLP POSタグまとめ https://qiita.com/syunyo/items/2c1ce1d765f46a5c1d72KeywordFixAnnotator 正規形がアスタリスクになっているのを修正するKeywordSequencePatternAnnotator 語の並びに対してパターンマッチを適用する
Pattern Annotator for Keyword Sequence (語の並び)LexTextAnnotator 属性をコピーする
プロパティ
from コピー元
to コピー先Nokku34Annotator 「名詞の名詞」を「word_nn_no_nn」キーワードとして抽出します。NumeralAnnotator Annotator for Numeral (数詞)
名詞のファセットキーワードのうち、数字のみのキーワードのファセットを数詞とする
例:
{lex:"103",facet:"名詞"}→{lex:"103",facet:"数詞"}ParseIntAnnotator 指定したフィールドを整数に変換するValueNormalizeAnnotator Normailze document value with Unicode NFKCWakachiAnnotator 日本語を分かち書きにするアノテーター
事前にキーワードをセットしておくこと