C
creation-zy
Unregistered / Unconfirmed
GUEST, unregistred user!
由于原贴太长,现在新开一个帖子,接着讨论人工智能的电脑实现。欢迎大家踊跃发言,
共同进步!
原贴见: http://www.delphibbs.com/delphibbs/dispq.asp?lid=934017
输入和输出是人工智能体的基本功能(也是普通电脑程序的基本功能)。对电脑来说,存在着
一种最基本的输入(觉受)——字符流输入。同样的,字符流也是电脑最直接的输出方式。
字符流可以看成是一种特殊的“触觉”(想到了盲文,唉...)——从它可以获得的信息只有
信息的前后顺序以及信息本身的差异。
智能的一个重要基石是思维(即人类的第六识)——意识。意识是智能的核心,它统摄其余
诸识。意识的基本功能是分辨力以及对“时间”的感觉。正是由于有“时间”感,我们才能将
两个或更多的事件联系起来,而不是所有的记忆形成一个大杂烩。
智能的另一个重要基石是模仿。现在存在一个问题:如何让这个人工智能体进行模仿?模仿是
一定要有对象的,单纯的字符流输入输出难以让他区分多个模仿的对象,因此,我们必须对智能
体的感觉和存在环境加以改进。
我们可以构造这样一个环境:总共两个主体,其中一个是由人完全控制的(包括所有属性和
动作),另一个就是我们制造的人工智能体。在这个环境中,前一个主体的任务是当老师,它的
任务是表现出状态的变化以及作出动作,让人工智能体进行模仿学习。而人工智能体要做的是:
能够“感受”这个“老师”,包括它的状态以及它发出的动作等。
在一个学习的例子中,智能体的学习过程如下:
环境: A,B 共两个个主体,其中A的所有状态、动作都 受人控制;B是人工智能体,有自控能力
主体的属性: happy: 愉快程度 hungry: 饥饿程度
初始状态: 两者的happy和hungry属性均为0
经过一段时间后: A的hungry上升为0.7,happy下降为-0.3 (人为操纵)
随后: A发出动作get food,获得了一个物品。 A发出动作eat food,物品food同时消失。
一段时间后: A的hungry恢复到0,happy上升为0.1
又经过了一段时间,A的hungry上升为0.7,happy下降为-0.3 ...
终于,B的hungry也上升了,为0.75,happy下降为-0.4
由于happy低于正常值,B意识到必须采取某种措施以增大happy值。通过对记忆的发掘,B发现
A在happy下降之后采取了 get food, eat food 的动作序列,提高了happy值,于是开始模仿A
的动作...
共同进步!
原贴见: http://www.delphibbs.com/delphibbs/dispq.asp?lid=934017
输入和输出是人工智能体的基本功能(也是普通电脑程序的基本功能)。对电脑来说,存在着
一种最基本的输入(觉受)——字符流输入。同样的,字符流也是电脑最直接的输出方式。
字符流可以看成是一种特殊的“触觉”(想到了盲文,唉...)——从它可以获得的信息只有
信息的前后顺序以及信息本身的差异。
智能的一个重要基石是思维(即人类的第六识)——意识。意识是智能的核心,它统摄其余
诸识。意识的基本功能是分辨力以及对“时间”的感觉。正是由于有“时间”感,我们才能将
两个或更多的事件联系起来,而不是所有的记忆形成一个大杂烩。
智能的另一个重要基石是模仿。现在存在一个问题:如何让这个人工智能体进行模仿?模仿是
一定要有对象的,单纯的字符流输入输出难以让他区分多个模仿的对象,因此,我们必须对智能
体的感觉和存在环境加以改进。
我们可以构造这样一个环境:总共两个主体,其中一个是由人完全控制的(包括所有属性和
动作),另一个就是我们制造的人工智能体。在这个环境中,前一个主体的任务是当老师,它的
任务是表现出状态的变化以及作出动作,让人工智能体进行模仿学习。而人工智能体要做的是:
能够“感受”这个“老师”,包括它的状态以及它发出的动作等。
在一个学习的例子中,智能体的学习过程如下:
环境: A,B 共两个个主体,其中A的所有状态、动作都 受人控制;B是人工智能体,有自控能力
主体的属性: happy: 愉快程度 hungry: 饥饿程度
初始状态: 两者的happy和hungry属性均为0
经过一段时间后: A的hungry上升为0.7,happy下降为-0.3 (人为操纵)
随后: A发出动作get food,获得了一个物品。 A发出动作eat food,物品food同时消失。
一段时间后: A的hungry恢复到0,happy上升为0.1
又经过了一段时间,A的hungry上升为0.7,happy下降为-0.3 ...
终于,B的hungry也上升了,为0.75,happy下降为-0.4
由于happy低于正常值,B意识到必须采取某种措施以增大happy值。通过对记忆的发掘,B发现
A在happy下降之后采取了 get food, eat food 的动作序列,提高了happy值,于是开始模仿A
的动作...