时间:2023-04-13 16:46:01 | 来源:营销百科
时间:2023-04-13 16:46:01 来源:营销百科
大数据环境下的空间聚类方法研究结题摘要:本项目的工作是面向大数据环境下的空间聚类技术研究,研究内容包括:为探讨传统聚类方法如何被扩展、移植到并行计算框架中,基于分布式计算框架Hadoop搭建了空间大数据的存储及聚类分析平台;深入研究了传统聚类算法、特别是K-means算法基于分布式计算框架MapReduce的实际应用情况;并针对多核处理器、耦合CPU-GPU结构下的大数据挖掘进行了详细分析;设计并实现了基于LDA主题模型的空间聚类算法,分析该算法在处理空间大数据时的优劣表现,进而基于深度学习及迁移学习方法,提出一种全新的基于Siamese网络的空间图像聚类算法,以解决训练数据匮乏、需人工提取特征等问题带来的挑战,以期为空间大数据的挖掘分析提供一种新的思路和技术。[1]关键词:研究,方法,环境,数据,空间