後工程ナビ
実務ガイド検査・品質 海外情報あり

測定のばらつき評価(Gage R&R)の基礎|繰返し性・再現性と%GRRの意味、判定ミスを防ぐ考え方

同じ部品を測っても、人や時間が変われば値は揺れます。その揺れが公差に対して大きすぎると、良品を不良と判定し、不良を見逃す測定起因のミスが構造的に発生します。測定システムという考え方、繰返し性と再現性、Gage R&Rの進め方と%GRRの意味、数値基準(10%・30%)の扱い方を、出典つきの一般的な目安として整理します。

公開:2026-06-11 更新:2026-06-11

この記事の読みかた

想定される利用シーン

次のような場面で役立つように整理しています。

  • 同じ部品なのに測定者や時間帯によって検査結果が変わり、原因を定量的に把握したい品質管理担当者
  • 取引先からMSA(測定システム解析)やGage R&Rの実施を求められた品質保証担当者
  • 公差限界付近の判定をめぐる社内・外注先との食い違いを減らしたい生産技術・購買担当者
  • 検査データを工程改善に使う前提として、データの信頼性を確認したい若手技術者

この記事で分かること

  • 測定システムという考え方と、校正だけでは足りない理由
  • 繰返し性・再現性の意味と、Gage R&Rが分離するばらつきの構造
  • %GRRが意味するものと、10%・30%という目安の扱い方(出典つき)
  • 測定ばらつきが引き起こす不良判定ミスの構造と、改善の優先順位

測定器そのものの管理は「測定器の校正・管理の基礎」、測定値が合わないときの切り分け全般は「寸法不良のトラブルシューティング」で扱っています。本記事は、その間をつなぐ「測定のばらつきを数字で評価する」という論点に特化しています。

測定システムという考え方

検査で得られる測定値は、部品の真の寸法そのものではありません。測定値の変動には、部品ごとの実際の寸法差(部品間変動)に加えて、計器・測定者・手順・環境からなる測定システムに由来する揺れが必ず混ざっています。この揺れが大きいと、工程は安定しているのに検査データが暴れて見えたり、その逆が起きたりします。

ここで押さえたいのは、校正だけでは測定システムを管理しきれないという点です。校正が管理するのは、計器の指示値のかたより(真の値からの系統的なずれ)です。一方、同じ部品を同じ計器で測っても値が揺れる、人が変わると値が変わる、というばらつきは校正では捉えられません。かたよりは校正で、ばらつきはGage R&Rで評価する。この二本立てが測定システム管理の基本構図です。

Gage R&R(ゲージの繰返し性・再現性評価)は、このばらつき成分を定量化する手法で、測定システム解析(MSA)と呼ばれる体系の中心に位置します。自動車業界の品質マネジメント(IATF 16949)に関連する顧客要求として実施を求められることも多く、業界を問わず使える考え方です。

繰返し性と再現性

Gage R&Rが分離するばらつきは、大きく2つです(図1)。

繰返し性(Repeatability)は、同じ測定者が、同じ計器で、同じ部品を、短時間に繰り返し測ったときのばらつきです。条件をすべて揃えても残る揺れであり、主に計器の分解能や機構、治具・固定方法、部品の当て方など、装置側の要因を反映します。

再現性(Reproducibility)は、測定者が変わることによって生じるばらつきです。測定力のかけ方、部品の持ち方、目盛りの読み方、手順の解釈といった、人と手順の要因を反映します。

実施方法の代表形は、複数の測定者が同じ部品群をそれぞれ複数回測る計画です(例として3名×10個×2〜3回という構成が広く知られています)。得られたデータから、部品間変動・繰返し性・再現性を統計的に分離します。重要なのは部品の選び方で、工程の実際のばらつきを代表する部品群を使わないと、比率の評価が歪みます。

測定値のばらつきの構造図。全変動が部品間変動と測定システムのばらつき(Gage R&R)に分かれ、Gage R&Rがさらに繰返し性(同じ人・同じ計器で繰り返したときの揺れ。計器・治具由来)と再現性(人が変わることによる揺れ。手順・技能由来)に分かれる階層を示し、どちらが大きいかで改善の打ち手が変わることを注記している

図1:測定値のばらつきの構造(一般化した概念図)

この分離が実務で効くのは、改善の打ち手が変わるからです。繰返し性が支配的なら、計器の更新や治具・固定方法の改善といった装置側の対策が必要です。再現性が支配的なら、手順の標準化と測定者の教育が先で、計器を買い替えても効果は限定的です。やみくもに対策する前に、内訳を見る。これがGage R&Rの最大の実益です。

%GRRの意味するもの

繰返し性と再現性を合成したばらつきがGRR(測定システムのばらつき)です。これを何かと比較して比率にしたものが%GRRで、比較先には2つの流儀があります。公差幅と比較する方法は「合否判定の道具としてどれだけ信頼できるか」を、工程の全変動と比較する方法は「工程の変化を見分ける道具としてどれだけ有効か」を評価します。報告書には、どちらに対する比率かを必ず明記します。

判定の目安として海外で広く知られているのが、%GRRが10%未満なら測定システムは良好、10〜30%は用途・コスト・リスク次第で許容、30%超は不適で改善が必要、という区分です。この目安は米国自動車産業のAIAGが発行するMSAマニュアルに基づくもので、計測専門誌の入門解説でも同じ区分が紹介されています(出典は参考情報を参照)。

ただし、この数値基準は絶対的なしきい値ではありません。出典であるマニュアル自体に、しきい値だけで測定システムの合否を決める運用は適切でないという注意書きがあり、海外では基準の統計的な根拠をめぐる批判的な議論もあります(海外セクションで紹介します)。10%・30%は会話の共通言語として有用ですが、最終判断は測定の目的とリスクに照らして行うものと位置づけてください。

測定システムが原因の不良判定ミス

Gage R&Rを「監査対応の書類仕事」にしないために、測定ばらつきが何を引き起こすかを押さえておきます(図2)。

測定値に揺れがある以上、真の寸法が公差限界の近くにある部品は、測るたびに合格側にも不合格側にも出得ます。つまり公差限界の両側に、判定が確率的にしか決まらないグレーゾーンが生まれます。%GRRが大きいほどこの帯は広がり、2種類のミスが増えます。

  • 良品の不合格(過剰拒否)。本当は公差内の部品を不良と判定し、歩留まり低下・再検査・外注先との返品紛争につながります
  • 不良の見逃し(誤合格)。本当は公差外の部品を合格と判定し、流出クレームにつながります

測定ばらつきによる判定ミスの構造図。横軸に部品の真の寸法をとり、公差の下限と上限の周囲に測定ばらつきによるグレーゾーンの帯が描かれている。帯の中では同じ部品でも測るたびに合格・不合格が入れ替わり得ること、グレーゾーンの外側では良品の不合格(過剰拒否)や不良の見逃し(誤合格)が起こることを示し、%GRRが大きいほど帯が広がる注記がある

図2:公差限界付近で起こる測定起因の判定ミス(一般化した概念図)

検査の見逃しというと検査員の注意力が話題になりがちですが、測定システムのばらつきは、誰が悪いわけでもなく構造的に判定ミスを生みます(検査の見落としが起きる理由)。また、抜き取り検査の設計(抜き取り検査と全数検査の使い分け)も、測定データが信頼できることが前提です。公差限界付近の値の扱い(再測定のルール、より細かい測定器での確認)を社内で決めておくことは、Gage R&Rの結果を実務に接続する最も具体的な方法です。測定器の選定と誤差要因の全体像は「寸法検査の基礎」をご覧ください。

現場で確認すべき判断ポイント

測定ばらつきの問題は、検査部門だけでは解決できないことが多くあります。以下の4区分で確認してください。

確認観点見るべきポイント関係しやすい部門
設計起因公差が測定システムのばらつきを考慮せず設定され、グレーゾーンが広すぎる設計・生産技術
加工起因工程内測定の計器・固定方法が最終検査と異なり、データが突き合わせられない製造・生産技術
検査起因計器の校正はしているがばらつきの評価をしておらず、限界付近の判定ルールがない品質管理
外注管理起因外注先と測定方法・計器・判定ルールの合意がなく、値の不一致が紛争化している購買・外注管理

「測定値が信用できない」と感じたら、まず繰返し性の簡易確認(同じ人が同じ部品を複数回測る)から始めると、少ない工数で問題の有無を見立てられます。

海外の研究・実務情報から

📘 このセクションについて:以下は、本記事の編集にあたって実際に参照した海外の専門誌記事・技術解説から、日本語ではまとまった形で読みにくい知見を紹介するものです。出典は「参考情報」に記載しています。

米国の計測専門誌Quality MagazineのGage R&R入門(Kappele and Raffaldi, 2005)は、測定データの変動を部品間変動・繰返し性・再現性の3つに分け、繰返し性と再現性の合成を測定の「ノイズ」と呼びます。%GRRの目安として10%未満・10〜30%・30%超の3区分を示したうえで、この記事が有用なのは、ばらつきの内訳から改善方向を導いている点です。繰返し性が再現性に比べて大きければより良い計器が必要であり、再現性が大きければ計器の使い方の訓練が必要、という対応です。さらにゲージ性能曲線という図を使い、部品の真の寸法に対して「公差内と判定される確率」がどう変わるかを可視化しています。%GRRが7%の系では誤判定が公差限界のごく近傍に限られるのに対し、14%、32%と大きくなるにつれて誤判定の起こる範囲が広がっていく様子が示され、測定ばらつきと判定ミスの関係が直感的に理解できます。

一方、品質管理コンサルタントのSPC Knowledge Base(McNeese, 2018)は、広く使われている10%・30%基準の機械的な適用に正面から異を唱えています。第一に、標準偏差ベースで計算される%の値は、成分を足しても100%にならない(標準偏差は加法的でなく、加法的なのは分散)という統計的な指摘。第二に、基準の出どころであるAIAGのMSAマニュアル第4版自体に、しきい値基準の単独使用は測定システムの合否判定の方法として適切でないという注意書きがあるという指摘です。同記事は代替として、Wheeler博士のEMP法(測定プロセスの評価)を紹介します。級内相関係数(全分散に占める部品分散の割合)に基づいて測定システムを4つのクラスに分類し、管理図上の信号をどれだけ減衰させるか、大きな工程変化を検出できるか、工程改善を追跡できるかという実用面で評価する方法です。この枠組みでは、%GRRが大きめでも工程監視には十分有用と評価されるケースがあり、同じデータがAIAG基準では不適、EMP法では一級と判定される例が示されています。基準値の暗記ではなく、測定の目的に照らした評価が必要だという主張です。

日本の現場で読み替えるポイント

  • 10%・30%という目安は、自動車系のサプライチェーンでは監査・顧客要求の共通言語として実際に使われています。取引上求められる場合はそれに従いつつ、社内の改善判断では「しきい値を超えたかどうか」より「繰返し性と再現性のどちらが大きいか」「判定ミスのリスクがどの寸法で高いか」を見るほうが、対策の費用対効果は高くなります。
  • EMP法のような代替的な枠組みをすぐに導入する必要はありません。読み替えるべき本質は、合否判定に使う測定と工程監視に使う測定では要求水準が違う、という一点です。
  • 本格的な実施の前に、同じ人が同じ部品を10回測る簡易な繰返し確認だけでも、測定システムの問題の有無はかなり見えてきます。小さく始めて、要求や必要に応じて正式なGage R&Rに広げる進め方が現実的です。

本記事の前提と使い方の注意

本記事は、金属加工の後工程・検査・品質管理に関する公開情報と、「参考情報」に記載した海外の専門誌記事・技術解説を参照し、日本の製造現場で起こりやすい論点とあわせて実務で確認しやすい形に整理したものです。Gage R&Rの実施手順・計算方法・様式の詳細は、AIAGのMSAマニュアル等の原典および取引先要求での確認を前提とし、本文中の数値基準(10%・30%)は出典に基づく一般的な目安として紹介したものです。

実際の判断は、測定の目的、公差の厳しさ、数量、取引条件、改善コストによって変わります。具体的な評価計画・判定基準の設計では、品質管理部門、取引先、計測の専門家と確認しながら進めてください。本記事は、その確認の前段として論点を整理するためのものであり、本サイトとして特定の数値基準・測定機器・メーカー・ソフトウェアの推奨は行いません。

このテーマでは、計算方法の知識だけで判断すると不十分です。実際には、部品の選び方、測定の目的(合否判定か工程監視か)、公差限界付近の判定ルール、外注先との合意内容をあわせて確認する必要があります。社内会議や外注先打ち合わせで本記事を使う場合、「現場で確認すべき判断ポイント」の表に沿って、自社のどこに論点があるかを最初に切り分けることをおすすめします。

まとめ

Gage R&Rは、測定値のばらつきのうち測定システムに由来する成分を、繰返し性(計器・治具由来)と再現性(測定者・手順由来)に分けて定量化する手法です。%GRRには10%・30%という広く知られた目安がありますが、出典のマニュアル自体がしきい値の単独適用を戒めており、測定の目的に照らした解釈が必要です。

測定ばらつきが公差に対して大きいと、公差限界付近で良品の不合格と不良の見逃しが構造的に発生します。校正でかたよりを、Gage R&Rでばらつきを管理し、ばらつきの内訳に応じて計器側・手順側の対策を選ぶこと、そして公差限界付近の判定ルールを決めておくことが、検査の信頼性を支えます。測定器の校正管理、寸法不良の切り分け、検査の見落とし対策については関連記事もあわせてご覧ください。

よくある質問

Q. Gage R&Rはどのように実施しますか?
A. 代表的な進め方として、複数の測定者(例として3名)が同じ部品群(例として10個)をそれぞれ複数回(例として2〜3回)測定し、得られたデータからばらつきの成分を分離する方法が知られています。部品は実際の工程のばらつきを代表するように選ぶことが重要です。詳細な手順と計算方法は、AIAGのMSAマニュアルなどの文献で確認してください。
Q. 繰返し性と再現性はどう違いますか?
A. 繰返し性は、同じ測定者が同じ計器で同じ部品を繰り返し測ったときのばらつきで、主に計器や治具、部品の固定方法に由来します。再現性は、測定者が変わることによって生じるばらつきで、主に測定のしかたや手順の解釈の差に由来します。どちらが大きいかによって、計器側を改善すべきか、手順の標準化と教育を優先すべきかが変わります。
Q. %GRRが30%を超えたら必ず測定器を買い替えるべきですか?
A. 必ずしもそうではありません。10%・30%という目安は広く使われていますが、出典としたAIAGのマニュアル自体に、しきい値だけで合否を決める運用を戒める注意書きがあります。測定の目的(合否判定か工程監視か)、公差の厳しさ、改善や代替手段のコストをあわせて判断するものです。まず、ばらつきの内訳(繰返し性か再現性か)を確認し、固定方法や手順の見直しなど費用の小さい対策から検討するのが現実的です。
Q. 校正をしていればGage R&Rは不要ですか?
A. 校正とGage R&Rは役割が異なります。校正は計器の指示値のかたより(真の値からのずれ)を管理するもので、人や手順を含めた測定のばらつきは評価できません。校正された計器でも、測定者によって値が揺れることはあります。かたよりは校正で、ばらつきはGage R&Rで、と両輪で考えるのが測定システム管理の基本です。
Q. %GRRは公差と全変動のどちらと比較しますか?
A. 両方の使い方があります。公差幅と比較する方法は合否判定の信頼性を、工程の全変動と比較する方法は工程管理データとしての有用性を評価する観点です。目的によって適切な比較先が変わるため、報告書にはどちらに対する比率かを明記する必要があります。
Q. 外注先と測定値が合わないときにGage R&Rは役立ちますか?
A. 役立ちます。値の不一致の原因が部品の真の変動なのか、双方の測定システムのばらつきなのかを切り分ける根拠になります。実務では、同じ部品群を双方で測定して相関を確認する方法と組み合わせ、測定器・固定方法・手順の違いを特定していくのが効果的です。

参考情報

  • Kappele, W. and Raffaldi, J., Quality 101 - An Introduction to Gage R&R, Quality Magazine(2005) — 測定データの変動を部品間変動・繰返し性・再現性に分ける枠組み、%GRRの一般的な目安(10%未満は良好・10〜30%は用途次第・30%超は不適)、繰返し性が大きければ計器側、再現性が大きければ測定者の訓練という改善方向、ゲージ性能曲線による公差限界近傍での誤判定確率の可視化(GRR 7%・14%・32%の比較)
  • McNeese, B., Acceptance Criteria for Measurement Systems Analysis (MSA), SPC Knowledge Base, BPI Consulting(2018) — AIAGのMSAマニュアル第4版に基づく%GRR基準(10%・30%)の解説と、しきい値の単独適用への批判。標準偏差ベースの%は加算しても100%にならないこと、マニュアル自体にしきい値単独での合否判定を戒める注意書きがあること、Wheeler博士のEMP法(級内相関係数による4クラスのモニター分類)では%GRRが大きくても工程監視に有用な場合があるという比較

関連する用語

次に読みたい記事

同じカテゴリの記事

「検査・測定・品質管理」カテゴリの他の記事もあわせてご覧ください。