第一章 农业数据的类型
农业是利用太阳光的能量,通过生物转化,生产人们需要的产品,即食物、工业原料和生物能源;又通过生物本身的存在(如森林、草地),改造自然,创造一个人类和生物本身所需要的理想环境。广义的农业包括种植业、畜牧业、渔业、林业和副业,狭义的农业,是指种植业。本教材主要涉及狭义农业数据的分析综合实践。
广义上,一切可以通过观察、试验或计算得出结果的信息都可称为“数据”,不只包括最常见的数字,还包括文字、图像、声音等多种形式。在统计学意义上,数字类型的数据(变量)可概括为三类,包括连续数据、类别数据和序列数据;连续数据是指数值型变量且数值连续不间断,例如作物产量;类别数据主要指名称等没有数值的变量,但常用数字表征,例如在表示颜色时,可以将不同颜色设置为不同整数;序列数据是介于连续数据与类别数据之间的变量,与类别数据的主要区别在于序列数据反映了变量内在的顺序,例如在表示程度时,可定义为数字数值越大,程度越深。类别数据和序列数据是非连续数据的两种不同形式。农业研究中连续数据占绝大部分,随着智慧农业的发展,测定手段及监测技术的进步也增加了农业研究中非数字数据的比例,例如遥感影像、温度热图等。根据数据获取的方式不同,可分为观测数据和试验数据两类,观测数据是指在自然的未被控制的条件下观测得到的,而对于一些问题,比如不同肥料条件下某作物的产量有无差别,则需要在人工干预的情况下设计特定试验,以这样的方式收集得到的数据称为试验数据,在农业研究中,多以试验数据为主。
农业的研究对象是农业系统中的生物、非生物要素及其整体。生物要素主要包括农业系统中的植物、动物和微生物,其中植物是最主要的研究对象。植物包括目标产物,即粮食作物、经济作物、蔬菜作物、绿肥作物、饲料作物、牧草、花卉等园艺作物,以及非目标植物,如杂草等。非生物要素主要指与农业生产活动相关的环境要素,如土壤、温度、降水、大气等。本书将农业研究中涉及的用来描述研究对象属性的数据统称为农业数据。
第一节 农业生物数据
农业的劳动对象是有生命的动物、植物和微生物,获得人类所需要的生物产品是农业生产的首要目的,此外,农业系统具有半人工、半自然的特性,农业生产的目标生物产品不可避免受到系统中其他生物的影响,甚至对所获取目标产品具有决定性作用。因此,生物是农业研究中最重要的对象,包括目标生物和非目标生物,描述生物性状的属性数据称为生物数据。
农业目标生物是农业产业的首要目标,目前对于目标生物的研究非常全面,涵盖了整个生命周期的全部过程。例如,研究水稻时,水稻产量和稻米品质是研究者最关心的性状,描述产量的属性数据包括产量构成(穗数、穗粒数、千粒重等)、单位产量、单位面积产量、收获指数等;描述品质的属性数据包括碾米品质(糙米率、整精米率等)、外观品质(垩白度、长宽比、不完整米率等)、食味品质(直链淀粉含量、支链淀粉含量、蛋白质含量等)、加工品质等。当然,水稻生长发育过程直接决定着水稻最终产量和品质的形成,研究者往往关注水稻关键生育期、关键过程的生长生理指标,例如出苗率、出苗均匀度、成活率、有效分蘖数、花前花后的干物质转运量、干物质转运效率、颖花分化、颖花数等。人类对于不同作物的需求不同,因此不同作物的重要生物数据不同,例如,牧草要关注其发酵品质,花卉要关注其外观颜色和气味性状等。对于生物的研究,除了涵盖整个生命周期,还涉及从宏观到微观的不同层次水平,从作物基因型到表型。作物基因型是指作物的基因组成,即品种,如氮高效品种、低排放品种等,作物基因型的研究对作物性状改良具有重要意义,现已从单个基因及其功能的研究转向功能基因组学的研究。作物表型是指基因型和环境决定的形状、结构、大小、颜色等作物植株的外在性状,不仅局限于农艺性状,还包括植株表现出来的生理状态。
农业系统中的非目标生物是决定目标生物的重要环境因素,也是农业研究的主要关注点。掌握农田杂草、害虫种类及其生物学特性,有利于采用针对性的技术手段实现精准、高效、生态的除草除害,以保证目标作物的养分、光照等资源充足,保证目标作物的产量及品质。明确土壤微生物、动物的生理和行为特性及其与作物根系及养分吸收的关系,有助于实现土壤养分的高效利用、节约外源化肥投人等,对农业系统健康、绿色发展大有裨益。
……
展开