八点看小说网

八点看小说网>学霸的军工科研系统腾讯 > 第758章 流形学习(第1页)

第758章 流形学习(第1页)

第758章流形学习

姚梦娜提出的这个问题,对于常浩南来说,不难理解。

只是很难解决。

真要说起来的话,这涉及到文本挖掘、数据可视化、信息检索、数据挖掘、机器学习乃至人工智能等一系列问题。

如果真做到姚梦娜所设想的那样全自动化生产,那就是工业4。o了。

在1999年这个时间点上,显然不大现实。

但不可能完全实现这一整套东西,并不意味着其中没有可以作为突破口的部分。

比如数据挖掘和信息检索,就是千禧年附近很火热的研究方向。

其核心目的是从海量数据库和大量繁杂信息中提取出有价值的知识,并进一步提高信息的利用率。

实际上,在常浩南重生之前,飞机设计和制造领域已经开始应用这方面的技术,他本人也接触过不少。

但当年的他作为一个工科出身的普通技术人员,并没有太多理论功底。

而系统,则先需要构建出一个完整且可行的思路出来。

这就导致如今他脑子里空有一大堆名词,但却不知道哪個是破局的关键——

实际上,他此时就面临着无法从大量繁杂信息中提取出有价值信息的困境。

“信息……”

常浩南从旁边扯过一张纸,在纸的最中间写下了两个字。

在理想化的模型中,最好是一个数据就可以精确且唯一地描述一个含义。

也就是一维数据。

小学和中学时候做的应用题,大体上就是这样。

实际生活中面临的,其实大多数也是这种问题。

而对于稍复杂一些的情况来说,要完全描述一个含义,往往需要一组数据。

但与此同时,这一组数据又往往不只能描述这一个含义。

要想在数学上描述这种一组(多个)数据对应多个含义的现象,就需要将一组数据在不同的维度上进行展开。

这是由数学理论推向现实的情况。

而反过来,现实中收集到的信息,在多数情况下,本身就是已经展开过的高维数据。

而如果想要让计算机处理这些高维数据……

常浩南思索半晌,又在纸上写下了三个基本条件:

1、对原始高维数据进行压缩,降低原始高维数据的维度,进而节省存储空间,同时也降低高维数据的计算复杂度。

2、消除,或者至少降低隐藏在原始高维数据中的噪声。

3、提取到高质量的数据特征,提升后续的数据表示和分类任务的效果。

他在脑子里把这三条内容过了一下,然后试图让系统给出一个结果。

没有反应。

显然,这并不能被算作是“完整且可行”的思路。

已完结热门小说推荐

最新标签