粒形と酒米適性との関係(6)

PCA.jpg 粒形と酒米適性との関係データは、サンプルが富山県産五百万石357点(29年、30年産こみ)、兵庫県産山田錦199点(同)、山形県産出羽燦々147点(同)、調査形質が粒長(X1)、粒幅(X2)、粒厚(X3)、千粒重(X4)、心白率(X5)、玄米タンパク質含有率(X6)(以下、これらの形質を変量と呼ぶ)、総計で4200点ほどである。
 このデータを品種別に二次元のグラフで散布図として描き(右図)、サンプルのグラフ上の分布から何らかの知見が得られるのでないか。グラフの作成には、統計学的手法である主成分分析を適用した。(注:主成分分析とは、個の変量1,X2,・・・、Xのもつ情報をm<pの総合特性値1,Z2・・・、Z(主成分と呼ぶ)に要約する手法である)。

 五百万石:第1主成分Z1のスコアと第2主成分のスコアZ2の散布図を見てみよう。第1主成分は、X3(粒厚)の負荷量がマイナス、X6(玄米タンパク質含有率)がプラスで小さい値の他は、いずれの変量ともプラスで大きい値をとることから、第1主成分は”玄米の大きさ”に関する総合特性値とみなせる。第2主成分は、X3(粒厚)の負荷量がプラスで、X6(玄米タンパク質含有率)がマイナスで大きいことから、第2主成分は”玄米の厚さとタンパク成分”に関する総合特性値と考えられる。このことから、Z1のスコアがプラス、Z2のスコアがプラスの第1象限に分布するサンプル群が酒米としての望ましい玄米特性を有すると推察される。さらに、29年産と30年産を比較すると、第1主成分Z1で明瞭に分かれており、両年産米の特性には違いがあることもわかる。なお、第1と第2主成分の累積寄与率は74%であった(6変量のもつ情報量のうち、二つの成分で74%の情報量があることを表す)。

 山田錦:第1主成分はX6(タンパク質含有率)の負荷量がマイナスで小さかったほかはX1~X5はいずれもプラスの大きい値であった。このことから、第1主成分Z1は”玄米の大きさ”に関する総合特性値を表している。第2主成分Z2はX6(タンパク質含有率)のみの負荷量がプラスで大きいことから、第2主成分は”玄米タンパク成分”に関わる総合特性値を表している。このことから、Z1のスコアがプラスで大きく、Z2のスコアがマイナスで大きい第4象限(玄米の大きさが大、タンパク成分が低)に分布するサンプル群が望ましい酒米としての玄米特性を有すると推察される。さらに、両年のサンプルは第2主成分Z2で明瞭に分かれていることもわかる。2成分の累積寄与率は63%とやや低かった。

 出羽燦々:第1主成分はZ6の負荷量が小さいほかはいずれの変量もプラスで大きい値であったことから、山田錦と同様に”玄米大きさ”に関わる総合特性値である。第2主成分Z2はX6(玄米タンパク含有率)のみの負荷量がプラスで大きく、”玄米タンパク成分”に関わる総合特性値を表している。すなわち、グラフの第4象限に分布するサンプル群が望ましい玄米特性を有するとみなせる。2成分による累積寄与率は71%であった。

 以上、産地を異にする3品種の調査データに主成分分析を適用することでサンプルは二次元グラフで分類できる。その情報量は70%程度であった。第1主成分の総合特性値は、3品種とも”玄米の大きさ”と意味付けされた。第2主成分は山田錦、出羽燦々で”タンパク成分”と意味付けされた。この結果は、酒米としての望ましい玄米特性を有するサンプルを簡易に分類できることを示唆している。31年産米のデータをも加えさらに検討を加えたい。

  
  

2019年4月 4日 11:40