溜まった表記ゆれは、 まとめて直す。
kintoneには、見た目は似ているのに別の文字として扱われる表記(康熙部首など)が入り込むことがあります。ベンリー文字置換は、すでに入っているデータを一覧から一括で直すほか、PDFやOCRデータからコピー&ペーストした文字を、レコードを保存する前に確認しながらそろえられます。
まずは無料でお試しください。一括置換を含む本番利用は買い切りライセンスが必要です。
Word・Excel の PDF 出力では、ほとんど起きません
問題になりやすいのは、どこから kintone にコピーしたかです。名刺 OCR、Web・PDF のコピペ、データ移行など、外部由来の文字列に康熙部首が混ざることがあります。
- 名刺・書類の OCR読み取り結果をそのまま貼り付け
- Web・PDF からのコピペ取引先サイト、請求書 PDF など
- データ移行・CSV旧システムや Excel マスタの取り込み
- AI 生成文章稀に、別コードの文字が出力される
康熙部首とは?
なぜ表記ゆれが問題になるのか
見た目は同じなのに、パソコンでは別の文字として扱われる漢字が214種類あります。意図せず混ざると、検索・照合・集計のどこかで困りごとが起きやすくなります。
康熙部首とは
清代の辞書『康熙字典』の部首表記をもとにした漢字で、見た目はいつも使う漢字とほぼ同じなのに、パソコン上の文字番号(文字コード)だけが違うものです。全部で214文字あります。旧字体や新字体の違いとは別の話で、「同じ字に見えるのに、データとしては別物」という点がポイントです。
例:「新築⼯事」と「新築工事」は、画面上は同じに見えても、データとしては別の文字列です。
なぜ入ってしまうのか
担当者が意図して使うことは少なく、次のような経路で気づかないうちに混ざり込みます。
- 名刺・書類の OCR 読み取り結果からのコピー&ペースト
- Web サイト・PDF からのコピー&ペースト
- 旧システム・CSV からのデータ移行
招く不具合・困りごと
人の目では同じ文字に見えても、システムは別の文字として扱います。
- 同一の顧客・店舗なのに別レコードとして重複登録される
- ルックアップや外部連携で完全一致の照合に失敗する
- CSVをExcelで開いてフィルターをかけると、見た目は同じ地名・社名なのに別の行として分かれる
- 集計・レポートで別件としてカウントされる
- 他システムとの名寄せ・マスタ統合がうまくいかない
- 使用フォントによって表示されない・□になる、端末ごとに見た目がバラバラに見える
kintone では最近、一覧の検索などで文字の正規化が行われるようになり、「田」で検索すれば康熙部首の「⽥」を含むレコードも、区別なくヒットしやすくなっています。検索の利便性は大きく改善されています。
一方で、レコードに保存されている文字そのものは自動では正規化されません。ルックアップの完全一致、重複チェック、API連携、CSVを使った外部処理などでは、これまでどおり表記ゆれが影響し得ます。ベンリー文字置換は、すでに入ったデータを一括変換して整え、PDFやOCRデータのコピー&ペーストを保存の入口で止めることを目的としています。
混入しやすいケースや文字コードの詳しい説明は、FAQ:実際に起きやすいケース・文字コードについてもご覧ください。
2つの役割。これから入る前に防ぎ、溜まった分も整える。
いちばん大切なのは、これから入ってしまう表記ゆれを保存の前に防ぐことです。すでにレコードにあるデータは、一覧画面から一括で直せます。
これから入る表記ゆれを、入口で防ぐ
レコードの新規登録・編集・インライン編集の保存時に置換表へ照合し、確認しながら通常字体へそろえます。意図せず混入しやすい経路を、データが溜まる前に止めます。
- PDF・OCRデータ・Webページなどからのコピー&ペースト
- 社外資料の旧字体・特殊字形がそのまま入るケース
- 担当者の手入力で、表記ゆれが新規レコードに載るケース
すでに入ったレコードを、一括変換
過去の運用で溜まった表記ゆれは、PC版レコード一覧の一括置換でまとめて修正できます。絞り込み条件に一致するレコードの対象フィールドを、置換表に沿って一括更新します。
- マスタ移行後の既存データクリーニングに
- 表記ゆれが散在しているアプリのまとめ直しに
- 実行前のバックアップ確認と、変換ログCSVの自動出力に対応
マスタ登録や手入力の表記ゆれに。
顧客名、店舗名、住所、商品名など。フィールドの型を変えず、今あるkintoneアプリにそのまま追加できます。
社名の旧字体・略字
「髙」「﨑」などを通常字体へそろえます。
地名・施設名のゆれ
手入力で揺れやすい表記を置換表で統一します。
記号・略称の統一
㈱や全角記号など、社内ルールに合わせて置換できます。
入力時のミス防止
保存前に確認し、意図しない表記を減らします。
入口防御と一括変換、どちらも現場で。
置換表はアプリごとに設定。日々の入力を守りながら、溜まったデータも整えられます。
入口チェック
一括置換
アプリごとに設定
マスタ内蔵
確認ダイアログ
通知・確認
書き出し・読込
使い方は、2つの流れ。
まず置換表と対象フィールドを設定したうえで、入口防御と一括変換を使い分けます。
① これから入るゆれを、入口で防ぐ
PDFやOCRデータのコピー&ペーストで紛れ込む表記ゆれを、レコードを保存する直前に確認しながらそろえます。
対象フィールドを選ぶ
置換表を整える
入力して保存
確認して確定
置換して保存 / 置換せず保存
② すでに入ったレコードを、一括変換
過去データの表記ゆれは、一覧画面の一括置換でまとめて整えます。実行前にバックアップ取得を確認します。
一覧で絞り込む
一括置換を実行
絞り込み条件に一致するレコードが対象
変換ログを確認
表記を統一
設定手順の詳細は まずこれだけ設定する をご覧ください。
利用イメージ(モック)
製品版のスクリーンショットは順次差し替え予定です。現時点では操作イメージをモックで示しています。
一覧:一括置換
絞り込んだ既存レコードの対象フィールドを、置換表に沿ってまとめて変換します。
PC:確認ダイアログ
PDFやOCRデータから貼り付けた文字を、保存する前に確認しながらそろえます。
「髙島屋」を「高島屋」に置換しますか?
モバイル:通知
外出先からの入力でも、保存時に置換候補を通知して入口で確認できます。
買い切り 78,000円(税別)
年額の更新はありません。kintoneのサブドメイン(例:sample.cybozu.com)ごとに1回お支払いいただくと、同じ環境内のアプリに何個でも導入できます。
1つの kintone 環境(サブドメイン)につき1ライセンスです。
- kintoneサブドメイン単位の買い切り
- 同じ環境内のアプリ数は無制限
- 例:sample.cybozu.com ごとに購入
- バージョンアップ提供
- ライセンス認証サービス利用
顧客提案・デモ環境での検証用途。審査のうえ、パートナーライセンスキーを提供します。
- 一括置換を含む本番相当の評価
- 顧客提案・デモ環境向け
- パートナー企業・個人が対象
まずは無料でお試しください。
ライセンス未登録でも、保存時の置換や設定画面の操作を確認できます。既存データの一括整理(一括置換)を含む本番利用は、買い切りライセンスをご購入ください。
無料試用で確認できること
置換表、康熙部首マスタ、確認ダイアログ、モバイル通知、設定ファイル、ログ記録、レコード保存時の置換を試せます。
無料試用の制限
置換対象フィールドは1件まで。一覧の一括置換は対象確認のみで、実行はできません。ライセンス確認のアラートが表示されます。
本番利用は買い切りライセンス
一括置換や複数フィールドへの適用など、制限なく使う場合は78,000円(税別)の買い切りライセンスをご購入ください。
パートナーライセンス(申請制・無料)
kintone 導入・活用支援パートナー向け。顧客提案・デモ環境で、一括置換を含む本番相当の評価ができます。
よくあるご質問
康熙部首の背景、混入ケース、文字コード、ライセンスまで。カテゴリから読むこともできます。
無料試用
無料試用では何ができますか?
ライセンス未登録の状態で、置換表の設定、康熙部首マスタ、確認ダイアログ、モバイル通知、設定ファイル、ログ記録、レコード保存時の置換を試せます。置換対象フィールドは1件まで、一覧の一括置換は対象確認のみです。
一括置換を試すには?
既存レコードの一括置換を含む本番利用には、買い切りライセンス(78,000円・税別)が必要です。購入案内をご覧ください。kintone 導入・活用支援パートナーの方は、パートナーライセンス(申請制・無料)もご利用いただけます。
康熙部首・表記ゆれ
康熙部首は、どんなときに kintone に入り込みますか?
担当者が意図して入力することはほとんどなく、外部データをそのままコピー&ペーストしたときや、取り込み・移行したデータに混ざっていることが多いです。見た目は普通の漢字と同じでも、パソコン内部では別の文字コードとして保存されます。
詳しい背景は製品ページの康熙部首とは?もご覧ください。
Word や Excel から PDF を作っただけでは、混入しませんか?
通常どおり Word や Excel で作成・編集し、標準機能で PDF 出力した文書そのものに、康熙部首が含まれることはほぼありません。Microsoft Office が扱う日本語は、一般的な Unicode 文字(いわゆる通常の「工」「田」「高」など)です。
問題になりやすいのは、Office で作った PDF かどうかではなく、どこから文字列をコピーして kintone に貼り付けたかです。スキャンした PDF の OCR 結果、名刺読み取りアプリ、Web サイト、AI が出力した文章、旧システムからの CSV など、Office 以外の経路から入った文字列に注意が必要です。
実際に起きやすいケースは?
現場で報告の多い例を整理しました。
- 名刺・書類の OCR … 名刺管理アプリ、スキャナー、スマホアプリで読み取った社名・人名・住所を kintone にコピー
- PDF・Web からのコピー&ペースト … 取引先サイト、電子カタログ、請求書 PDF などから社名・商品名を貼り付け
- データ移行・CSV 取り込み … 旧 kintone/基幹/Excel 管理のマスタをそのまま移行したデータ
- 中国語圏の資料・フォント … 海外製資料や、環境依存のフォントで作られた外部ファイル
- AI が生成した文章(レアケース) … ChatGPT などの AI 出力をそのまま、または何度もコピーし直して kintone に貼り付けたとき。通常の日本語入力よりは稀ですが、AI 側が康熙部首に近い字形・別コードの文字を出力することがあります
いずれも「入力ミス」というより、見た目では判別しにくい文字が、そのままデータとして入るパターンです。ベンリー文字置換は、保存時に検出して止める(入口防御)ほか、すでに入った分を一括で直す用途向けです。
「見た目は同じなのに別文字」とは?文字コードについて
パソコンは文字を文字コード(Unicode のコードポイント)という番号で管理しています。人の目では同じに見えても、番号が違えば別の文字として扱われます。
・通常の「工」 … U+5DE5
・康熙部首の「⼯」 … U+2F2F
→ 画面上は同じに見えても、データ上は別物
康熙部首 214 文字は、おおむね U+2F00〜U+2FD5 の範囲に割り当てられています(CJK 部首補助)。旧字体・新字体(例:「髙」と「高」)とは別の種類の表記ゆれです。
この違いが問題になる場面の例:
- kintone のルックアップや外部 API で完全一致の照合が失敗する
- 同じ顧客名なのに別レコードとして登録される
- CSV を Excel で開き、フィルターをかけると見た目は同じ社名なのに行が分かれる
- 集計・名寄せで別件としてカウントされる
kintone の一覧検索では、最近の仕様変更により正規化されてヒットしやすくなった場合もあります。ただしレコードに保存されている文字そのものは、自動では書き換わりません。ベンリー文字置換の確認ダイアログでは、変換前後の Unicode コードポイントも表示するため、「本当に別コードか」を保存前に確認できます。
康熙部首と旧字体(「髙」「﨑」など)の違いは?
旧字体・異体字(例:「髙」↔「高」、「﨑」↔「崎」)は、字体の違いとして別の Unicode 番号を持つ文字です。康熙部首(例:「⼯」↔「工」、「⽥」↔「田」)は、もともと辞書の部首記号に由来する別グループの文字で、見た目が通常漢字とほぼ同じものが 214 種類あります。
どちらも「見た目は似ているのに別文字として扱われる」点では同じ種類の困りごとを招きます。ベンリー文字置換では、康熙部首 214 文字マスタで部首系を一括カバーし、旧字体や社内ルール(略称など)は置換表に個別追加できます。
ライセンス・料金
パートナーライセンスはありますか?
kintone の導入・活用支援を行っているパートナー企業・個人向けに、顧客提案・検証用のパートナーライセンスを無償(申請制)で提供します。一括置換を含む本番相当の評価が可能です。パートナーライセンス申込をご覧ください。
料金はいくらですか?
買い切り78,000円(税別)です。年額の更新料はありません。1つの kintone サブドメインにつき1ライセンスで、同じ環境内のアプリ数に制限はありません。
買い切りですか?年額ですか?
買い切りです。お支払いは1回のみで、ライセンスの年次更新はありません。
ライセンスはユーザー数課金ですか?
いいえ。利用人数ではなく、kintoneのサブドメイン(環境)単位です。同じ環境内であれば、何人が使っても、アプリをいくつ入れても構いません。
導入・設定
既存アプリの項目変更は必要ですか?
基本的には不要です。プラグイン設定で対象フィールドを選び、置換表を整えるだけで利用を開始できます。
どのフィールドに適用できますか?
1行文字列・複数行文字列など、テキスト系フィールドを対象に選べます。詳しくは活用ガイドをご覧ください。