海量数据处理。RFID设备的大规模部署会产生空前的海量数据。据统计,沃尔玛三天内会产生超过美国国家图书馆所包含的总体数据量。即使是部署适量的RFID设备公司一天之内也会产生十几亿字节的数据。
过滤与清洗。现有的RFID读写器在读取标签时会产生误差,如漏读、多读和脏读等。据统计,现实世界中部署的RFID读写器的漏读率达到30%-40%。不准确的数据对于高层的应用是无用的,有时甚至会导致做出错误的决策。因此,在数据进入系统之前要对其进行预处理。
挖掘语义信息。被观察的RFID数据通常携带有与上下文状态和背景知识相关的信息,而这些信息通常是隐含的,且与上层应用逻辑之间存在密切关系。例如,从产品EPC码可查出它的型号、价格及产地等;从读写器的位置可得知物品所在的位置等。原始RFID数据是一种低层的基础数据,必须上升为高层的业务逻辑数据并与应用相集成,才能真正发挥作用。
展开