分类: 深度学习
大模型AlpacaFarm分析
一、摘要 本研究工作介绍了一个名为AlpacaFarm的模拟框架,旨在降低模型从人类反馈中学习方法的成本。作者…
大模型中的RepE表征工程
Highlight 论文地址: 表征工程(RepE)是一种借鉴认知神经科学的见解来…
大模型也是一种优化器(LLM as Optimizer)
论文:Large Language Models as Optimizers arXiv: Affiliation: …
学术idea自动发现与生成
摘要 研究人员通常只有在深入了解大量文献后才能提出新的想法。学术出版物的数量呈指数级增长,这一事实加…
自回归语言模型(language model)Python实现
自回归语言模型 自回归语言模型是一种计算概率的模型,它可以预测一个给定的单词序列中下一个词的概率。它…
DeepScience:学术趋势预测与分析
导言 在此Github仓库中,我们选择COVID-19和深度学习领域来预测科学的发展趋势。 我们使用AceMap中的论文…
对比学习中常见的数据增强策略
对比学习 对比学习是一种通过对比正反两个例子来学习表征的自监督学习方法。对于自监督对比学习,下一个等…
对比学习Python实现
对比学习是一种通过对比正反两个例子来学习表征的自监督学习方法。对于自监督对比学习,下一个等式是对比…
迁移学习模型DANN实现
Individual differences in EEG signals lead to the poor generalization ability of EEG-based affective m…
生成对抗网络GAN图像生成实例
本文实现了DCGAN [1],这是一种生成对抗网络。DCGAN模型将完全连接层替换为全局池层。众所周知,GAN的目的…
知识图谱中的结构信息建模
什么是知识图谱 全球最具权威的IT研究与顾问咨询公司高德纳发布了2020年AI领域技术成熟度曲线,其中知识图…
ICLR2021图神经网络与知识图谱相关论文
Theory HOW NEURAL NETWORKS EXTRAPOLATE: FROM FEEDFORWARD TO GRAPH NEURAL NETWORKS 作者研究了通过梯…
速读-对抗攻击的弹性异构DNN加速器体系结构
Paper: Wang, Xingbin, et al. “Dnnguard: An elastic heterogeneous dnn accelerator architecture …
速读-张量流处理器(TSP)
Paper: Abts, Dennis, et al. “Think fast: a tensor streaming processor (TSP) for accelerating …
神经网络高维互信息计算Python实现(MINE)
论文 Belghazi, Mohamed Ishmael, et al. “Mutual information neural estimation.” Internat…
速读-A3基于注意力机制的神经网络处理器
论文:Ham, Tae Jun, et al. “A^ 3: Accelerating Attention Mechanisms in Neural Networks with A…