推測言語

テキストの自然な言語を推測
今すぐダウンロード

推測言語 ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • LGPL
  • 出版社名:
  • Kent Johnson
  • 出版社のWebサイト:
  • http://code.google.com/u/kent3737/

推測言語 タグ


推測言語 説明

テキストの自然な言語を推測します 推測言語はUnicode(UTF-8)テキストの自然言語を判断しようとしています。 Trigramsディレクトリと日本語、中国語、韓国語、およびGreek.guess_languageに記載されているすべての言語は、その言語を検出するためのサンプルテキスト内の文字セットとTrigramsに基づいてヒューリスティックを使用します。サンプルテキストにHTMLタグなどのマークアップが含まれている場合、それはより長いサンプルではよりよく機能します。文字列はUnicodeまたはUTF-8テキストでなければなりません。言語識別子は、英語の言語名、2文字または3文字または3文字または3文字または3文字目のIANAコード、言語ID、または3つのコードすべてを含むタプルです。プライマリエントリポイント、戻り値は次のとおりです。 ) - IANA言語CODEGUESSLANGUASETAG(TXT) - IANA言語コード(推測言語と同じ)japanageName(TXT) - LANKUGEGUESSLANGUAGEID(TXT) - 言語IDGuessLanguageInfo(TXT) - (IANAコード、ID、名前)要件のタプル: ・Python


推測言語 関連ソフトウェア