コンテンツへスキップ

異体字同一視検索

2011年6月17日(金)ことば, ソフトウェアPHP, ことば, ソフトウェア, 日本語

PostgreSQL をバックエンドに、フロントエンドを PHP でどうにか書いて、自前のデータベースを仕事に使っています。そこでたまに異体字を同一視してほしい(たとえば「斎藤」さんだったか「齊藤」さんだったかうろ覚え)ときがあるのですが、それほど頻度も高くないし、人間が注意して対処(「読み」も登録しているので「さいとう」で検索)すれば乗り切れるので、つい後回しにしていました。

そろそろ何とかしなければ、と web を検索したところ、「異体字同一視検索」を見つけました。そう、以前に調べたときにこの方と同じく「漢字データベースの異体字データベース」を見つけてはいたものの、そこからどうしようと思いながらそのままにしていたのでした。

さっそくそのページの説明のとおりに自分のスクリプトに組み込みました。こちらでは日本語のいわゆる旧字体があれば十分で、簡体字は必要ではないのですが、そのままで快適に機能しています。このように情報を公開していただいていることに大変感謝しています。

共有:

X
Facebook

関連

投稿者: Mako

Mako のすべての投稿を表示

投稿ナビゲーション

過去の投稿インターネットラジオを FM ラジオで聴く

次の投稿 GNOME でのシャットダウンの禁止—最近の流儀

コメントをどうぞコメントをキャンセル

serif
Noto Serif
BIZUD Serif
ヒラギノ明朝
游明朝
sans-serif
Noto Sans
BIZUD Sans
ヒラギノ角ゴ
游ゴシック

WordPress サイト管理者の実務ノート
半月記について

タグ

CSS Debian DNS Emacs Errbot Firefox gdm Git GNOME Google HTML hubot IPv6 IRC Jabber Markdown MediaWiki pandoc PDF PHP PostgreSQL Python subversion TeX Twitter Wnn WordPress Xfce XMPP おもちゃことばこどもインターネットソフトウェアテーマフォントプラグイン写真日本語暮らし校正機器算数自動車薪ストーブ

カテゴリー

Debian
Jabber/XMPP
WordPress
インターネット
ことば
ソフトウェア
写真
暮らし

ブログ継読

メールアドレスを登録すれば、更新をメールで受信できます。

メールアドレス

RSS

RSS - 投稿
RSS - コメント

検索

検索:

過去の記事

2026
1 3
2025
5
2024
11
2023
7 9 10 11
2022
4
2020
3 12
2019
1 2
2018
1 2 3 4 5 6 11 12
2017
1 2 3 4 5 7 11
2016
3 5 6 11
2015
3 5 6 10 11
2014
1 3 4 5 6 7 8 9 10 11 12
2013
1 2 3 5 7 8 9 10 12
2012
1 2 3 4 5 6 11 12
2011
1 5 6 7 8 9 12
2010
1 2 4 6 7 10 11
2009
2 4 5 6 9 10
2008
2 3 11
2007
1 2 3 4 6 7 8 9 10
2006
3 4 5 8 9 10

Copyright©2011 Mako N

Proudly powered by WordPress | Theme: Libre 2 by Automattic.