大家一起来讨论!关于汉语发音的难题!要求能较流畅的哦!!<font color="#ff0000" size="5">(大讨论)</font&

  • 主题发起人 主题发起人 yiyu
  • 开始时间 开始时间
当时我们的王码是怎样产生的?? 也许当时的人也认为这是不可能的。但现在可成为
家常便饭了!这就是创新啊!
 
没声音了啊??
 
笑傲糨糊真幽默 I 扶了 U了
 
欢迎大家多多贯水!嘻嘻:)无聊!
 
当时我们的王码是怎样产生的?? 也许当时的人也认为这是不可能的。但现在可成为
家常便饭了!这就是创新啊!

-------王码那玩意是不错,但怎么能跟你这个项目比呢,你这个项目比它那牛多啦!

建立一个库是个想法, 做个功能强在的语句分析模块! 给出个句子,分析它的什么什么率!
分解出来!一个一个地去生成它的语音流!然后一起把我个流播放出来!呵呵:) 个人想法!

----你这个库是如何建法,建什么?
"功能强在的语句分析模块"怎么做?

要上知天文,下知地理,各行各业, 无所不通, 前知人类文明发源时,
从郁达夫的"在春风沉醉的晚上"到汪国真的打油诗,
从李洪志的"转法轮"到川端康成的"伊豆舞女"
从某某人的毕业论文到美女作家的小说,
从幼儿园的"鹅鹅鹅,曲项向天歌"(插一句, 这个倒容易实现)到
名著"大代数",
从刘勰的"文心雕龙"到国家领导人明年的团拜会上的致词等等

怎么分析, 如何实现

1、 要解决多音字在一句话中的读音。 这要求联系上下文来判断一个字的读音。
2、 一个字单独读与在一个句子中读发音是不一样的它要与前后字和整句话所表
达的意思有很大的关系。
3、在读句子时要注意速度、语气等问题。

特别是: 某一天有个小子突然跑到你的机器前,批里啪啦敲几下键盘,输入
"笑傲糨糊真幽默 I 扶了 U了",让它动无比激动地读出来,行吗?



*****一句话, 你告诉我怎么让它无所不懂吧, 如果你做不到这一点, 你那三点怎么搞****


------------------------------------------------
建大型AI词类判断
----光词类判断, 差远啦
语法分析要做
还要有语气, 比如当我在一个句子里给"牛"加个双引号的时候,
它得知道,我表是讽刺还是佩服,翻开语法大词典,
双引号有几十种意思啊.
光看这一句还不行, 因为你还要把这句话放到文章背景中理解啊...
等等等等.
勾架现在是就可以研究了
----是啊, 我们都在讨论这个问题研究的可行性和必要性.
硬件可能等以后再说吧
-----我情愿相信你能自己做个CPU,然后自己写个操作系统, 然后自己做个开发工具,
比如说DELPHI6就是你写的

但要我相信你这个, 除非你拿着一只小木枪顶着我的脑袋.


----做一个无所不能的东西, 注定是要失败的.
再做一个比全世界的人还狡猾的东西, 首先你要比全世界的人都要狡猾.



****不是说不能做, 而是做之前,一定要划分一个功能要实现的界限, 而且这个界限是可行的****




我帮你把问题再提一遍,欢迎各位给我们的YIYU多出主意.



按照目前的技术我知道这是个很大的难题不过没关系在这有各路富翁只要每人出点主意
一点想来法,也许问题就解决了目前微软不也在研究这个课题吗?

我个人对这个问题的难点看法有哪下几点:

1、 要解决多音字在一句话中的读音。 这要求联系上下文来判断一个字的读音。

2、 一个字单独读与在一个句子中读发音是不一样的它要与前后字和整句话所表
达的意思有很大的关系。

3、在读句子时要注意速度、语气等问题。

如果上面的问题都解决了到时可真是可以实现人机对话就不难了啊!
请各位富翁发表发表意见!

论者有分,有成绩的高分!




 
我是比较赞成“房客”,
比较反对“笑傲江湖”
为什么,因为在这个世界没有东西是不可能的,语音将来一定
能发展到非常流利的。<strong>现在当然还不行!</strong>
当以后CPU 10000000TTG Mhz时,硬盘100000TTTTG时(传输速率是光速的N倍)
等等等等时,很多东西变成可能。
对吗?

 
最近我在研究ttts(text to Speech) !但不能读中文 ,我也想知道怎么才能实现中文
语音输出 !
 

我不懂这些,但对连续读有点想法:分析平时读一句话的强度变化,找出一个和句子
长度相关的函数,这样可能听起来会好一点。
 
TO WEICONG:
你看清问题没有?

说穿了,这个问题根本就不是技术问题,而是不可能的问题.

我不知微软是不是在做类似的事, 如果他果真在做,他要做的也是有个功能界限的.

我也绝对相信"语音将来一定能发展到非常流利的", 但肯定是无感情的机械.
但要流利到

1、 要解决多音字在一句话中的读音。 这要求联系上下文来判断一个字的读音。
2、 一个字单独读与在一个句子中读发音是不一样的它要与前后字和整句话所表
达的意思有很大的关系。
3、在读句子时要注意速度、语气等问题。

门都没有.

这个问题绝非编程能够解决的.
即使
"当以后CPU 10000000TTG Mhz时,硬盘100000TTTTG时(传输速率时光速的N倍)
等等等等时,很多东西变成可能。"
这个东西也不能实现.

做一个什么库,再让软件根据这些库作出一些联想功能,N年前就有的技术.
问题是它能满足这个问题的要求吗.
即使你把库做得很大很大很大很大.
把联想功能做得很强很强很强很强.



 
to:笑傲江湖
也许你把问题夸得太大了吧。按照目前的技术去想要实现这个功能真是天方夜谭。
但我们总得去研究的!!
就象当时人是怎样让金属说话的!!到目前为止我们不是实现了?电话我们天天都用。
之些以前的人肯定也是想是个天方夜谭。还有电是怎样产生的?等等这些都要靠我们人
去研究,现在微软在研究,他们是集多学科的人在研究的。不象我们关从程序上去思考
也许我们要定义许许多多的协议。

比如定义一个很大的发音原则库,发音前都经过一系列的判断决定发什么音。唉,我
真是才疏学浅啊!

大家继续!

 
to:笑傲江湖
我提出
"当以后CPU 10000000TTG Mhz时,硬盘100000TTTTG时(传输速率时光速的N倍)
等等等等时,很多东西变成可能。"
目的是说这样的东西需要庞大的运算力,与储存能力。
=======================================
你太自负了,将来的事,谁都是猜测,但没有绝对的。

其实你已经说明这是可以的。
>>做一个什么库,再让软件根据这些库作出一些联想功能,N年前就有的技术.
>>问题是它能满足这个问题的要求吗.
>>即使你把库做得很大很大很大很大.
>>把联想功能做得很强很强很强很强.

当发现联想有没有联想到的就加上去,
当发现库不够时再加上去,
这只是时间的问题,对吧!
时间+当以后CPU 10000000TTG Mhz时,硬盘100000TTTTG时(传输速率时光速的N倍)
等等等等时=可能
为什么不可能呢?也许一万年,也许十万年,一百万年,
我已经把事情说清楚了。
我的观点是:有可能。





 
to weicong:
错,我绝不自负,这是任何一个有头脑的有点常识的人都会想到的问题,
而不是凭者一个程序员的头脑发热.

-----那就让大家再看看你的搞笑答案吧!

***
当发现联想有没有联想到的就加上去,
当发现库不够时再加上去,
这只是时间的问题,对吧!
时间+当以后CPU 10000000TTG Mhz时,硬盘100000TTTTG时(传输速率时光速的N倍)
等等等等时=可能
为什么不可能呢?也许一万年,也许十万年,一百万年,
我已经把事情说清楚了。
我的观点是:有可能。
****

----事物都有一个发生发展灭亡的过程,计算机从出现到今天令人热血沸腾
实在没几天,它的消失不会到你说的那个期限.

你这个说法,纯属于完全不可行的抬杠.



to yiyu:
现在微软在研究,他们是集多学科的人在研究的。不象我们关从程序上去思考
也许我们要定义许许多多的协议。

比如定义一个很大的发音原则库,发音前都经过一系列的判断决定发什么音。唉,我
真是才疏学浅啊!

大家继续!

----我基本同意你的说法,只是微软在做这个事时,肯定给自己定了一个也许一年,
也许三年,也许十年也许更长的目标, 而这个目标至少在理论上是切实可行的.

问题有难度是一方面, 是不是切实可行又是一方面.


撇开这个话题先不说,谈一个小问题(性质上不同于我们现在讨论的问题).

经常可以看到一些人在规划软件前功能简直牛得不得了,
真正实现出来的东西简直不能用,在功能上不是这个限制,就是那个限制.
原来承诺的那些功能现在要么是没实现,要么就是实现得不够完整.
我相信你身边就有这种人.

然后说时间/精力/(有些老实点的也承认)技术上等等不足啦.

客观地讲,这些软件只要客观条件满足了, 都是可以实现的.
但是,要满足这些客观条件何其难也.既然是这样, 那就必须对
当初的不切实际的设计作出检讨!

不要说微软,就是你,一赌气,搞个能朗读的东东出来,完全有可能.
不要说你,就是微软,想搞一个聪明无比的知道它任何要读的东西是什么意思的东东, 门都没有.
 
笑傲江湖:
分析得很透彻,也很准确,不过似乎绝对了一点
大家是讨论而已 没有必要从0分析到1的吧 呵呵
无论该技术可能不可能 幼稚不幼稚
任何技术(可能这都不能算是技术)都是要从诞生到灭亡的
MIS做多了可能回来想想自己的毕业论文还是比较可爱一点
就现在人类讨论去10000光年外找亚地球 ,那是好来屋
就现在人类讨论吃饭是否一定要吃饱,那是没事找事
但我们中的一部分人(很多成分是世界级科研单位的)一定需要验证什么东西我们吃了没毒
这个话题显然不是在讨论三层的DCOM在98如何烦
也不是在讨论谁对谁错
我们关注的是技术的可行性和探讨价值,笑傲江湖兄也说了
并不是MS在做课题 就一定是真理
但什么东西一棍子打死,说的毫无价值那是需要很大勇气和根据的
也许今天的判断标准就是根据,就是真理,可全世界50多亿人就有50多亿不同的判断标准
我们还是回到正题乱点技术谱吧(亵渎科学??)
不管是空泛的灌水骗分 还是针砭难题
 
语音辨识 技术现在已经在应用中了
尽管CTI现在很大程度上讲做的是一个大概念
看看这:
<a href="http://www.ctiforum.com/technology/asr/asr0502.htm" target="_blank"><img src="http://www.ctiforum.com/technology/asr/asr0502t01.jpeg"></a>
从上边的讨论我们也明白:人机界面自然化发展何其重要!
ViaVoice是幼稚的成功。声音频率的采样分析技术也在提高,关键是硬件发展的跟上
我们可以先看简单的应用。。
欢迎继续
 
房客兄叫我来看看,呵呵,怎么有点像辩论

正方:房客兄
反方:笑傲江湖

这个问题呢
就本人愚见,现在要实现开始所说的功能,我比较赞成反方
就发展到100000T来说,我赞成正方

呵呵,哪边风大我往哪边到……

我原来编过TTS有关的软件,不过只是皮毛,也不知其具体原理
我的想法是分解汉字的拼音,采用类是英文的读法
要知道,就算硬件在发展,一个好的算法也是由必要的
并不是应为现在计算机快了,就用很多不考虑系统占用等的方法
同样的功能,能用汇编和VB实现,一个占用更少的资源,速度更快
你用哪个,不用说了吧

所以说,也许使用大量的词库,甚至句库来实现连续语音发音
比分解拼音更流畅,但是付出的代价好高出好多好多,不划算

开个玩笑的说法,为了以后的发展,我决得应该给机器汉字发音定一个标准
像什么GB什么的,然后,人用那个标准去进行人机对话,这不是跟快

好了,说到此,大家GO ON ……
 
再给出几个连接:
语音识别(Automatic Speech Recognition)
http://www.ctiforum.com/technology/asr/asr.htm
http://www.ctiforum.com/technology/tts/tts0306.htm
 
to 房客,
>>但什么东西一棍子打死,说的毫无价值那是需要很大勇气和根据的
>>也许今天的判断标准就是根据,就是真理,可全世界50多亿人就有50多亿不同的判断标准
厉害,一针见血(我要从小学再重新学语文了)。

to 笑傲江湖,
服了你了,但是我还是想说,象这种事情,你"似乎绝对了一点"。
好了,我不再搞"搞笑答案"(真的很搞笑吗?)。
我太愚昧了,好,我接下来,只听你的高见。
 
我投降:)
大家都还是朋友吗:)

话都说到这个份上啦,我也检讨一下吧:(

本来以为YIYU说着玩的,准备写个自娱自乐的东东锻炼一下编程本领.
(不要跟我提编程,我不行的)
所以就很随意的推荐了那个SOFT999.
没想到...
害,
你们什么时候到南京,我请客吧.
 
有我份吗?不如到深圳来,我请客好吗?
 

Similar threads

D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
2K
DelphiTeacher的专栏
D
D
回复
0
查看
1K
DelphiTeacher的专栏
D
后退
顶部