注册登录
产品
社群
✓
使用“Bing”搜本站
使用“Google”搜本站
使用“百度”搜本站
站内搜索
注册登录
问答
博客
标签
用户
活动
极客观点
项目管理
HarmonyOS
热门标签
javascript
php
java
vue.js
git
html5
python
node.js
android
mysql
react.js
linux
ios
css
golang
spring
docker
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
问答
博客
标签
用户
活动
极客观点
项目管理
HarmonyOS
热门标签
javascript
php
java
vue.js
git
html5
python
node.js
android
mysql
react.js
linux
ios
css
golang
spring
docker
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
请问这个RNN哪里出现问题了?
张威
6
2
发布于
2021-02-24
前面的代码运行都没有问题
深度学习
自然语言处理
有用
1
关注
3
收藏
0
回复
阅读 1.1k
1 个回答
得票
最新
mhxin
84
5
发布于
2021-03-24
没有发现前一行最后少个括号吗
有用
回复
撰写回答
你尚未登录,登录后可以
和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进,让解决方法与时俱进
注册登录
推荐问题
请问AI推理加速有推荐的书吗?
请问AI推理加速有推荐的书吗?学习路线是什么?
1 回答
1.4k 阅读
为什么 qwen/Qwen2-VL-7B-Instruct-GPTQ-Int4 推理图片的需要超过8GB的额外显存?
在测试 qwen/Qwen2-VL-7B-Instruct-GPTQ-Int4 发现一个问题,就是纯文本的推理,显存占用在 7GB+,但是只要 question 中带上一个图片,立刻 OOM
962 阅读
使用Tensorflow框架进行猫狗识别项目但是,奇数epoch正常训练,偶数epoch中acc与loss为0,这是为什么?
{代码...} 希望每一轮都可以正常训练
1 回答
737 阅读
如何让 vlm 视觉大模型记住一整部电视剧?
参考: [链接][链接][链接][链接][链接]假设在使用上面的 vlm 的时候。我想让其记住《甄嬛传》76 集里面的所有剧情和画面呢?怎么添加训练?有思路可以分享吗?训练之后,我希望可以实现的效果:问它第几集几分几秒再讲什么,可以告诉我对应的剧情给它一个图片,可以告诉我出现在第几集的几分几秒
798 阅读
Transformer推理过程中token输出不一致如何处理?
使用Transformer进行推理时,假设正确推理输出是“我爱中国”,在第一次推理时,decoder的输入是“<SOS>”,decoder的输出是“我”,在第二次推理时,decoder的输入是“<SOS>我”,decoder的输出是“我爱”,在第三次推理时,decoder的输入是“<SOS>我爱”,decoder的输出应该是“我爱中”。会不会出现一种可能,在...
147 阅读
宣传栏
1053
没有发现前一行最后少个括号吗