DeepSeek和ChatGPT在学术研究哪家强(二)

DeepSeek横空出世,那么,DeepSeek和ChatGPT在学术研究上哪家强?
我们接上一篇文章《DeepSeek和ChatGPT在学术研究哪家强(一)
DeepSeek和ChatGPT在学术研究哪家强(二)


并以Github上3.5k+的学术写作Prompts此作为基准提示符,来测试一下DeepSeek和ChatGPT的结果如何。
DeepSeek和ChatGPT在学术研究哪家强(二)


(一) 头脑风暴 BRAINSTORMING
1.2 咱们来看第二个问题,写一篇关于某主题的研究建议(Research Proposal),这里提一嘴,RP是作为与潜在博导沟通,套磁申请博士所必须经历的环节,这里我们继续以大语言模型(Large Language Model)为例:
DeepSeek和ChatGPT在学术研究哪家强(二)
基于上一篇,我们将研究主题聚焦至“Efficiency and Scalability of LLMs”:
因此,提示符如下:
“Write a detailed proposal on the research topic: Efficiency and Scalability of LLMs. Make Sure it is free from plagiarism. ”


两者结果分别如下:
by DeepSeek:
DeepSeek和ChatGPT在学术研究哪家强(二)


by ChatGPT:
DeepSeek和ChatGPT在学术研究哪家强(二)


接下来我们具体看下两者的表现如何,以下内容为简洁易读,已经由Google翻译,并整理成表格进行对比:
a). 先看RP的生成结构:总体上看,二者生成文章的结构都包含了RP所需要的基本框架,差别如下,在主题上DeepSeek更为具体,同样是LLM模型的效率与可扩展性,DS将新型架构、训练范式和部署策略展现在标题中,从而让主题更为具体,而ChatGPT的主题略显宽泛。
章节
by DeepSeek
by ChatGPT
标题
“提升大规模语言模型的效率与可扩展性:新型架构、训练范式和部署策略
“大规模语言模型 (LLMs) 的效率与可扩展性”
引言
聚焦于大规模语言模型的成就及其在计算成本、能源消耗和可访问性等方面的挑战。
强调了大规模语言模型的成就,并探讨计算成本、可扩展性和环境影响方面的挑战。
研究问题
合并在引言和研究目标部分中。
独立为单独章节,突出资源消耗、可扩展性、压缩技术和边缘部署等关键挑战
研究目标
四个目标:模型效率、可扩展性、部署优化和评价框架。
四个目标:资源高效的训练与推理方法、模型压缩技术、可扩展性策略和环境影响评估。
研究问题
明确列出四个问题,涉及计算成本、可扩展性、优化和权衡。
没有单独列为章节,但在目标和方法论部分间接涉及。
文献综述
纳入到方法论第一阶段:“文献综述与问题分析”中。
独立为单独章节,讨论了模型压缩技术、高效架构、硬件优化和可持续性研究等内容。
研究方法
分为五个阶段:文献综述、效率技术、可扩展架构、部署优化和评估。
包括五个阶段:计算瓶颈分析、效率技术、可扩展框架、环境影响评估和验证测试。
预期成果
为提升效率和可扩展性开发新技术、提出可扩展架构、优化部署策略及建立基准测试方法。
资源高效的技术、可扩展框架、减少的能源消耗,以及高影响力的学术论文和会议出版物。
研究意义
强调模型的可访问性、可持续性和大规模语言模型的民主化。
突出模型的可访问性、环境责任,以及在性能、效率与可扩展性之间的平衡。
时间表
详细的基于阶段的时间表,约 24 个月完成,包含每个阶段的里程碑。
类似的基于阶段的时间表,但总计约 25 个月,部分阶段的时长略有不同。
所需资源
高性能计算集群、大规模数据集和软件工具。
高性能计算资源、公共数据集,以及研究资源和会议参与所需的经费
结论
旨在解决大规模语言模型的效率和可扩展性问题,使其更具可访问性和可持续性
聚焦于通过技术创新解决效率与可扩展性问题,确保大规模语言模型的可持续发展与部署
DeepSeek和ChatGPT在学术研究哪家强(二)


b). 再看RP的生成内容

结构与细节:

DeepSeek 提案:更关注结构化的研究阶段,强调基准测试以及在资源受限环境中的部署。

ChatGPT 提案:包括单独的文献综述和环境影响章节,视角更为广泛


具体性:

DeepSeek 提案:更专注于技术进步和架构设计(如模块化网络、专家混合机制和分层模型)。

ChatGPT 提案:更体现扩展性,比如可持续性和环境问题领域。


研究问题:

DeepSeek 提案中明确提出,ChatGPT 提案中以相对隐性的方式呈现。

DeepSeek和ChatGPT在学术研究哪家强(二)


c). 再看RP的AI生成的痕迹
我们将原始生成的英文,通过业界权威的Quilbot AI Detector来识别AI生成的痕迹如何。
DeepSeek: 总共生成了899个英文单词,AI检测率为95%。
DeepSeek和ChatGPT在学术研究哪家强(二)


ChatGPT: 总共生成了810个英文单词,AI检测率为100%。
DeepSeek和ChatGPT在学术研究哪家强(二)


论文查重不仅仅需要检查文章重复率,AI检测率也是重要指标之一,硕士、博士论文,以及发表文章在大出版社如Springer,Elsevier等,都有明确的AI检测率要求,一般需要20%以下
尽管两者都是AI工具,从AI检测率上,DeepSeek在生成更多文字的情况下,依然高出ChatGPT 5个百分点,这一点确实值得惊叹~
DeepSeek和ChatGPT在学术研究哪家强(二)


因此,就研究建议(Research Proposal)提示符来说,文章结构上二者大同小异,都能够满足RP的基本要求。两个提案都结构清晰,覆盖了重叠的主题,但重点有所不同,大家可以根据学术和研究目标灵活调整。
研究内容上,如果需要更明确的研究方向,选择DeepSeek;如果需要更强的扩展性,选择ChatGPT。
此外,千万记住一点,生成的文章一定要从专业领域的角度读一遍进行确认,并且,AI检测率尽管DS比GPT低,但是95%的AI检测率是肯定被Desk Reject的,所以仍然需要对内容进行去AI痕迹,这个会在将来的文章中与大家分享。

这个激动人心的主题将会继续,后续我们将进一步对后续的Academic Prompts进行测试、研究和分析,未完待续呃,欢迎留言~

关注我,了解学术研究之路中关于AI的一切~



[附] DeepSeek和ChatGPT答复:
DeepSeek
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)


ChatGPT
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)
DeepSeek和ChatGPT在学术研究哪家强(二)


参考链接:
[1]https://github.com/ahmetbersoz/chatgpt-prompts-for-academic-writing
[2]https://chatgpt.com/
[3]https://chat.deepseek.com/
[4]https://translate.google.com/
[5]https://quillbot.com/ai-content-detector
DeepSeek和ChatGPT在学术研究哪家强(二)

原创文章,作者:门童靖博士,如若转载,请注明出处:https://www.agent-universe.cn/2025/01/36344.html

Like (0)
Previous 2025-01-28 10:38
Next 2025-01-30 02:33

相关推荐