Skip to content
本页目录

ai业务

企业知识助理

背景:我们每天都充斥大量的信息,而我们每个人的精力有限,加上短视频快餐文化横行,人们花在阅读上面的时间越来越少,如何提高阅读的质量,如何用有限的精力来快速获取并掌握高质量的信息显得尤为重要。

目标:openAi擅长自然语言处理,将openAi的能力融合到知识库中来做文档的阅读理解,改变传统的阅读模式,输入企业知识库给openAi尽行分析,提炼摘要内容,可以询问某个部门的规章制度,某个技术的流程细节,还可以通过追问的方式补充问答,对于不清楚的地方可以补充名词解释、证明逻辑、阅读翻译、划词解释、文档归类打标签。

亮点:让AI来学习理解知识库内容,用户借助AI的能力可以快速学习和理解知识

创新点:改变传统的阅读学习方式,借助Ai的学习理解能力,获取知识可以用检索和追问方式来学习,有目的的针对性学习来提高学习效率

可行性:用RSS订阅+爬虫的方式拿到用户可以读取到知识库内容,然后输入给openAi进行分析处理,用编程方式抹平输入openAI对token长度限制,用专业prompts提升AI理解力。

文本摘要和视频摘要技术研究

背景

对于长文本和长视频用户是没有耐心从头看到尾的,用户只关注对自己感觉兴趣的信息,对自己感兴趣才会详细阅读查看,因此摘要功能显得尤为重要,提炼出知识库和会议视频的摘要,让用户可以快速获取自己想要的信息。

存在的问题

当前openAI提供的聊天接口表现了一定的本文处理能力,对于短文本可以直接处理,但并不能直接处理长文本和音视频。需要解决的问题有: • 模型token长度限制怎么处理 • 上下文回话怎么关联 • 视频转音频 • 音频分割 • 摘要准确度怎么优化

解决方案

  1. 使用文本分割,了解token计算规则
  2. 采用embedding
  3. 音视频分割 相关库
  4. 摘要准确度优化调参,暂无不清楚 当前实践 [x] 读取AP文本 [x] 读写word本文 [ ] 后端联调接口提取短文本摘要 [ ] 创建文本和文本写入AP 待处理问题 • embedding的用法还需要学习

参考资料

ai业务 has loaded