| 1.辞書開発フロー |
| |
| 辞書の開発には大きく分けて5つのフェイズがあります。 |
| |
|
1.用語の収集・・・
|
〈1〉用語の採択(既存辞書ツールより)
〈2〉用語の切り出しとマイニング(論文・書籍より) |
2.用語の整理・・・
|
〈3〉重複語整理(頻度集計)
〈4〉不要語排除 |
3.辞書の設計・・・
|
〈5〉用語カテゴリーの種類
〈6〉階層の範囲 |
4.用語の分析・・・
|
〈7〉階層ツリーの設定
〈8〉同義語・関連語のリンク付け |
5.辞書の編集・・・
|
〈9〉用語コードの付与・重複語整理(頻度集計)
〈10〉用語リンクの展開(論理チェック) |
|
| |
| 2.要 件 |
| |
| ケース・バイ・ケースで用途やご希望に合わせて開発いたします。参照語の種類やその選定基準の厳しさ、元データの有無やその状態、階層構造の有無、対訳英語データの有無、語数と用語の範囲などを主な基準にしてお見積いたします。 |
| |
|
| 見出し語(実際に検索されるインデックスとなる用語)から参照される用語には、表記ゆれ語、略語、同義語、関連語、広義語(上位語)、狭義語(下位語)があります。種類が多く、作業に手間がかかるものほどコストが大きくなります。 |
| |
|
| 元になるデータがある場合、調査などが不必要になるためコストは下がります。データがない場合でも開発は可能です。また、元になるデータがカテゴリー分けされた電子用語集などのように、そのまま用語の整理に使用できる場合、文書から用語を拾い上げる場合よりもかなり低コストになります。元データが電子文書や紙文書で存在する場合もご相談ください。 |
| |
|
| 上位語、下位語などの言葉の階層をもつ完全なシソーラス構造の辞書を使用すると、検索の精度はあがりますが、開発コストはかさみます。これは、構造の設計や構築、論理性チェックなどに技術と工数が必要とされるためです。 |
| |
|
| お客様がお持ちのデータに対訳英語がついているかどうか、また、対訳英語をつける必要があるかどうかによってもコストは変わります。対訳英語については、仕様によってお客様のコストが増減いたします。詳しくはご相談ください。 |
| |
|
| コストの調整が必要である場合、語数や必要な用語の範囲を限定することでもある程度対応が可能です。仕様検討時にご相談ください。 |
| |
| 3.お見積 |
| |
お客様のご要望や検索要件にあわせて、ご相談の後、お見積いたします。
→見積もり例: 500円〜800円/1ワードグループ*+調査料・データ加工料など
*ワードグループ・・・見出し語(中心となる言葉、インデックス)と参照語を含む用語のグループ
<上記見積もりの要件整理例>
- 2万語(ワードグループ)程度
- 元データあり(電子文書)
- 階層無し
- 参照語は同義語のみ
- 対訳英語一部付与済み
|
カスタム辞書に関するお問合せ  |