您的位置: 百康网 > 期刊 > 中医学 > 《甘肃中医学院学报》 > 2007年2月第1期 > 正文
K-均值聚类法对甘肃省临夏州当归引种区划的分析
http://www.100kang.com 2007-5-5 9:47:33 K-均值聚类法


  摘  要:通过统计学上的K-均值聚类法对当归在甘肃省临夏州的适生种植进行农业气候区划,以避免因不当引种带来的损失,并借此来说明统计学方法在农业区划方面的重要作用。

  关键词:K-均值聚类法;农业气候区划;当归;引种
   
  无论是种植业还是养殖业,农业生产与气候条件关系十分密切。农作物与家禽、家畜的正常生长发育、产量形成及品质优劣,都对气候条件有着具体要求。充分利用气候资源,遵循气候规律,对搞好农业结构调整、发展农业支柱产业和区域经济都具有十分重要的先导作用。当归,别名秦归,为伞形科(Umbelliferae)多年生草本植物当归Angelica sinensis (Oliv.) Diels的干燥根,甘温质润,为补血要药,有养血润肠通便之功;此外,亦有补血、活血、调经之效,又为妇科要药,是中药常用药,现在多制成营养性食品及保养性化妆品。本文就临夏州的气候资料进行分析,并参照道地当归产地甘肃岷县的气候资料来划分出临夏州的当归适宜、不适宜种植区,以供引种参考。

  1  资料来源及方法

  1.1  资料来源当归喜冷凉阴湿气候,怕暑热高温,要求土壤质地疏松,有机质含量高,适宜在高寒阴湿区种植。根据研究,优质当归的生长气候适宜指标为:年平均气温4.5~5.7 ℃,年降水量500~650 mm, ≥0 ℃积温2450 ℃左右,7~8月平均气温<18 ℃\[1\]。据此选择下列因子作为聚类的气候因子:X1——年平均气温, X2——年降水量,X3——≥0 ℃积温,X4——7月平均气温,X5——8月平均气温。表1给出了甘肃省临夏州所属各气象站多年(1971年至1990年)平均气候资料\[2\],另外岷县为优质当归产地,在此引入了岷县的气候资料作为区划参考。

  表1  临夏州各气象站气候资料样本 略

  1.2  研究方法

  1.2.1  基本原理选择一批有代表性的样本作为中心(凝聚点),将各个样本按最近距离原则向中心点汇聚,从而得到初始分类。下一步任务是判断初始分类是否合理,如果不合理,就修改分类;如果修改后仍不合理,就再次修改分类,直到合理为止。

  1.2.2  具体方法步骤第一步,在给定的样本中,选取K个样本作为中心。计算每一个样本离这K个中心的距离,将距离最小的归入相应的一类。如果某一个样本与n个中心的距离都相等,则将此样本归入相应的一类,或根据经验归入某一类,按上述原则,可将n个样本初分为K类。第二步,对上述每一分类,按其所含全部样本对各个因子分别计算平均值。以所得到的K类均值为中心,再计算每一个样本与这K个中心的距离,于是可得到新的修改后的K分类。第三步,比较前后两次分类是否一致,若一致则聚类过程结束; 若不一致,则继续重复上一步工作,直至前后两次分类相一致时为止。这样就可把各样本分成了最终的K类\[3\]。

  2  结果与分析

  2.1  初始聚类在给定的9个样本中选择3个样本: 1号样本 (代表最优种植区)、6号样本 (代表较适宜种植区)、9号样本(代表不适宜种植区)作为凝聚中心,计算每一个样本与1、6、9号样本的距离。以2号样本为例,其与1号样本的距离:d2,1=│5.3-5.7│+│583.0-579.9│+│2568.3-2592.6│+│16.3-16.1│+│15.9-15.7│=28.2其与6号样本的距离:d2,6=│5.3-6.5│+│583.0-478.3│+│2568.3-2911.1│+│16.3-17.7│+│15.9-15.7│=450.3其与9号样本的距离:d2,9=│5.3-9.2│+│583.0-283.4│+│2568.3-3544.9│+│16.3-21.2│+│15.9-20.1│=1289.2同理,分别计算3号、4号、5号、7号、8号样本与1号、6号、9号样本的距离,列入表2,并进行聚类。

  表2  初始聚类样本 略
   
  将距离最小的样本归入相应的一类,若某一个样本与这3个中心的距离全相等,则将此样本归入相应的一类,按上述原则可将9个样本划分为3类。由表2可得初始聚类结果(用样本代号表示): 第Ⅰ类  1,2,4,5,8第Ⅱ类  3,6,7第Ⅲ类  9

  2.2  第二次聚类以初始聚类的结果为新中心,按其所含全部样本对各个气候因子求平均值,以所得到的3类均值为新的样本中心,再计算每一个样本与这3个新样本中心的距离,便得到修改后的新聚类。以初始聚类结果为新的中心,计算各类因子平均值列入表3。

  表3  初始聚类的新中心的气候资料 略
   
  用表1与表3来进行第二次聚类,分别计算9个样本与第Ⅰ类、第Ⅱ类、第Ⅲ类的距离,将结果列入表4中,并进行聚类。

  表4  第二次聚类表样本 略
   
  将距离最小的样本归入相应的一类,若某一个样本与这3个中心的距离全相等,则将此样本归入相应的一类,按上述原则仍可将9个样本划分为新的3类。由表4可得第二次聚类结果(用样本代号表示):第ⅰ类  1,2,4,5,8第ⅱ类  3,6,7第ⅲ类  9

  2.3  聚类分析通过比较前后两次聚类,第二次聚类结果与初始聚类结果一致,则聚类过程结束,至此,将9个样本划分为最终的三类。根据分类结果评述各类所包含区域及其主要气候特征、存在的气象问题、当归种植的优略。由表3得:第ⅰ类,最优种植区(包含岷县、和政、积石山、临夏县、东乡)为冷凉的半湿润地区,年平均气温5.1~6.3 ℃,年降水量536.3~667.2 mm,≥0 ℃积温2438.0~2723.9 ℃,7月平均气温16.0~17.0 ℃,8月平均气温15.3~16.3 ℃。冷凉阴湿、夏季凉爽,这些因子都符合优质当归种植的气候指标,这些地方种植当归,将得到产量高、质量优的当归。第ⅱ类,较适宜种植区(包括康乐、广河、临夏市)为温和半干旱地区,年平均气温6.1~6.8 ℃,年降水量478.3~532.9 mm,≥0 ℃积温2833.3~3011.2 ℃,7月平均气温17.5~18.8 ℃,8月平均气温17.0~17.6 ℃。夏季温度较高,年降水量也较少,干旱及夏季高温影响当归产量及品质,这些地方不利当归生长,若这些地方引种当归,其产量一般,质量良好。第ⅲ类,不适宜种植区(永靖)为温暖的干旱地区,年平均气温9.2 ℃,年降水量283.4 mm,≥0 ℃积温3544.9 ℃, 7月平均气温21.2 ℃,8月平均气温20.1 ℃。可见夏季高温危害、雨量不足,不适宜当归种植\[2\]。

  3  小结
 
  本文采用K-均值聚类法,对甘肃省临夏州当归引种区划提供了一种定量的数学描述方法,通过论证结果表明效果良好,且较客观地反映了临夏州当归引种的实际情况。采用K-均值聚类法进行合理的作物气候区划,关键在于所选聚类指标的优势。本文所采用的气候生态因素是在农业气候分析的基础上进行的优选,故其效果较好。作为地区一级的农业气候区划,由于气象资料的局限性,各县气象站的气候资料并不能全面反映全县气候的差异性,故所完成的甘肃省临夏州当归引种区划略显粗糙。
 
  参考文献:
 
  \[1\]朱国庆.甘肃中部当归生态气候分析及适生种植区划\[J\].甘肃气象,2001,19(1):36-38.
 
  \[2\]崔学祯.临夏州当归适生种植生态气候研究\[J\].甘肃农村科技,2002,(5):34-36.
 
  \[3\]冯定原.农业气象预报和情报方法\[M\].北京:气象出版社,1988:172-177.
  
  作者简介:贠寿民(1983-),男,中草药栽培与鉴定专业2003级学生。

  甘肃中医学院,甘肃  兰州  730000

  指  导  杜  弢,邓国伦


  
《甘肃中医学院学报》2007年2月第22卷第1期