エロゴン

Ellogonはクロスプラットフォーム、マルチリンガル、汎用言語エンジニアリング環境です。
今すぐダウンロード

エロゴン ランキングとまとめ

広告

  • Rating:
  • ライセンス:
  • GPL
  • 出版社名:
  • Georgios Petasis
  • オペレーティングシステム:
  • Windows All
  • ファイルサイズ:
  • 10.6 MB

エロゴン タグ


エロゴン 説明

Ellogonは、計算言語学の研究をしている研究者、ならびにLanguage Engineeringを作成して提供する企業の両方を支援するために開発されたクロスプラットフォーム、多言語、汎用言語エンジニアリング環境です。 Language Engineering PlatformとしてのEllogonは、テキスト/ HTML / XMLデータと関連言語情報、字句情報のサポート(辞書の作成と埋め込みなど)、注釈付きコーパスの作成、データベースへのアクセスのためのツールなどの豊富な設備のセットを提供しています。注釈付きデータの比較、またはさまざまな機械学習アルゴリズムで使用するための言語情報をベクトルに変換する。 過去10年間に、自然言語処理の分野でRDを促進することを目的とした多数のソフトウェアインフラストラクチャが表示されています。 LT-NSL / LT-XMLツールやゲートなどのこれらのインフラストラクチャのいくつかは、世界中の多くの機関によって幅広いタスクに適用されているため、非常に人気がありました。 Ellogonは参照ベースのプラットフォームのカテゴリに属し、言語情報はテキストデータとは別に保存され、元のテキストに参照します。 Tipsterデータモデルに基づいて、Ellogonはインフラストラクチャを提供します。 ・テキストデータの管理、保存、交換関連言語情報。 ・言語処理コンポーネントの作成、埋め込み、管理。 ・適切なプログラミングインタフェース(API)を定義することによって、異なる言語コンポーネント間の通信を容易にする。 ・テキストデータと関連言語情報を視覚化する。 EllogonはTipsterアーキテクチャと同じデータモデルを共有しています。これにより、ゲートなどの他のティップスターベースのインフラストラクチャとともに、一部の基本機能を共有しています。ただし、そのようなインフラストラクチャと区別する多数の機能も提供しています。 Ellogonにデータを格納するための中央要素はコレクションです。コレクションは文書の有限セットです。エロゴン文書は、テキストデータとテキストデータに関する言語情報とで構成されています。この言語情報は、属性と注釈の形式で格納されています。 属性は特定のタイプの情報を型付値と関連付けます。注釈は、テキストデータの一部と任意の情報(属性の形式)を関連付けます。 スパンと呼ばれる各部分は、いくつかのテキストデータの最初の文字から測定された、部分の開始文字と終了文字を示す2つの文字オフセットで構成されています。 注釈は通常4つの要素で構成されています。 ・数値識別子。この識別子は、文書内の注釈ごとに固有であり、注釈を明確に識別するために使用できます。 ・タイプ。注釈タイプは、注釈をカテゴリに分類するために使用されるテキスト値です。 ・注釈付きテキストデータの範囲を示すスパンのセット。 ・一連の属性。これらの属性は通常必要な言語情報をエンコードします。 現在の形のエロゴンはこれらすべての要件を満たしています。 EllogonはTipsterアーキテクチャに基づいているので、それはゲートのような他のTipsterベースのインフラストラクチャと多くの基本プロパティを共有しています。 ただし、Ellogonは同様のインフラストラクチャと区別するいくつかの重要な機能を提供しています。 ・簡単な部品開発 新しいコンポーネントを開発し、Ellogonによって提供された機能を使ってそれらを開発するプロセスを理解するのはかなり簡単です。さらに、C、C ++、Java、TCL、Perl、Pythonなど、コンポーネント開発のための広範囲のプログラミング言語がサポートされています。 ・統合開発環境 Ellogonは、コンポーネントの開発サイクルを完全にサポートするため、統合開発環境として機能します。コンポーネントは、内側のエロゴンから作成、編集、コンパイル、リンクされ、リンクされます。 さらに、C / C ++ / Javaコンポーネントは、Ellogonから終了しなくても、アンロード、変更、コンパイル、およびエロゴンにリロードすることができます。すべてのコンポーネントをアンロードまたはリロードする機能は、コンポーネントの修正をすぐに評価できるため、開発サイクルを大幅に削減できるため、不可欠です。 ・コンポーネントの使用準備完了「ツールボックス」 Ellogonには、注釈付きコーパスの作成、ベクトル生成、またはデータ比較などのタスクを実行するための多数の使用できるツールが装備されています。 さらに、トークン化、音声タグ付けまたはGazetteer List Lookupなどの基本的なタスクを実行するさまざまなドメインや言語に適応できるいくつかのサンプルコンポーネントが提供されています。 最後に、Ellogonは、インアノテーションデータベースの単純なビューアから視聴者に階層的な情報を表示することができるいくつかのデータ視覚化ツールを提供しています。 ・簡単展開 Ellogonが分解可能なアーキテクチャを実装するので、特定のタスクを実行する一連のコンポーネントから簡単な製品を作成することは非常に簡単です。 必要なエロゴン部品と共にすべてのコンポーネントは、単一の実行可能ファイル(インストールなし)またはアプリケーションとしてパッケージ化できます(これは、マルソーレーションシステムの下では変更されません)。これらの特殊なアプリケーションは、エロゴンがシステムにインストールされていない場合でも、どのようなシステムで配布して使用できます。 要件: ・Tcl / Tk 8.4(または新しい)、 ・Java JDK / JRE 1.4.1(オプション) ・Perl 5.8.1(オプション) ・Python 2.2(オプション)。


エロゴン 関連ソフトウェア

ファウスト2000

英語、ドイツ語、そしてデンマーク語の言語で動作する辞書プログラム。 これらの言語のいずれかから翻訳できること。 各方向に約150000ワードやフレーズを含みます。 能力 ...

186 5,491K

ダウンロード

CCNA試験準備

CCNA 2.0試験準備ソフトウェアでCisco CCNA 2.0(#604-507)試験に準備します。 あなたが1回目を渡すのを助けるためにすでに何千人もの候補者によって証明された、私たちのソフトウェアはそれぞれの目的の私を壊します ...

287 3,513K

ダウンロード

静かな

クイズマスターとクイズウィザードが含まれています。 クイズマスターはオンライン複数選択テストオーサリングアプリケーションです。 クイズマスターを使用してカスタマイズされた複数選択句を作成してください。 ...

162 1,570K

ダウンロード

WordTester 2.0

簡単かつ迅速に外国語を勉強したい人のために開発された、新しい外国語の学習を容易にする複数の方法が含まれています。 使いやすく、新しいVを学ぶための素晴らしいツールです ...

147 4,800K

ダウンロード