前言

本文是西南石油大学闵帆老师《论文写作》课程的总结。课程聚焦计算机领域学术论文的写作方法及注意事项,非常适合初步接触科研,需要撰写学术论文的同学们。

学术论文5W

  • 是啥?WHAT:对研究工作的阶段性总结;不需要文采的八股文;结构清晰
  • 为啥?WHY:毕业条件;职称评定;知识传承与学术宣传
  • 咋整?HOW:阅读文献后总结归纳;使用他人总结的模板
  • 何时?WHEN:随时!越早越好!
  • 何地?WHERE:随地!哪里都行!

论文内容

如何选题

  • 从学习中总结:多阅读文献,了解相关领域的发展和研究,选择自己相对感兴趣以及擅长的领域进行研究
  • 适当选择范围:题目过大,无法具体化讲述;题目过小,内容无法展开且文献资料少
  • 提出关键问题:与实际相结合提出关键性问题,要有一定的先进性和适当的难度,既要有理论分析也要有实验说明
  • 向身边人请教:可以向导师、实验室的师兄师姐请教,或在实验中慢慢发现

组成部分及具体要求

标题

中肯而闪亮,就像给孩子取名
  • 有吸引力:抓住读者的眼睛
  • 易于理解:选取在领域内常用的术语或词汇
  • 易于检索:提高曝光率及被引用频次
  • 少用base on:太土,用trough/with更好

摘要

把文章重要的内容抽出来,主要包括三个部分:已有工作的评述、本文工作的描述、实验结果

摘要10句法:

  1. 问题及重要性:简单介绍问题背景及其重要性。告诉读者本文的研究领域及研究主题
  2. 已有工作:介绍解决该问题的最新方法
  3. 已有工作局限:当前最新方法的不足和问题,注意语气不要太强硬
  4. 本文工作:介绍本文的主要工作、贡献及创新点
  5. 本文方法的第 1 个技术/步骤/方面/优势/贡献
  6. 本文方法的第 2 个技术/步骤/方面/优势/贡献
  7. 本文方法的第 3 个技术/步骤/方面/优势/贡献
  8. 实验设置:简单概括使用的数据集、实验参数等
  9. 实验结果:注意强调对比前人的效果
  10. 提升:简单吹嘘一下自己,本文对后人的启发和应用

关键词

原本用于论文检索。虽然现在可以进行全文检索,但关键词仍然很重要
  • 作为摘要的补充
  • 一般需要3-5个关键词
  • 每个关键词由1-3个单词组成
  • 按照字母表顺序排序

引言

讲述完整的故事,承上启下
  • 对整篇文章的内容进行详细的讲述
  • 可以采取和摘要相同的节奏。将摘要中的每句话扩展成为一段
  • 每段应该有5-10句话
  • 在计算机领域流行“开局一张图”的形式,那么引言部分就应该围绕这张图进行解释

文献综述

总结前人的工作,不能简单罗列
  • 每篇文章都应该有文献综述部分,表示对前人工作的尊敬
  • 可以在不同的地方描述。在引言部分、相关工作部分、实验之后都可以
  • 需要分门别类介绍:例如不同的实现方法等。注意不要使用年份作为线索,会有堆砌的感觉
  • 不应将参考文献的引用作为句子的主语、宾语等,这样你就失去了自己的观点
  • 不要一次引用太多文献:一次不要超过 3 篇,会有不尊重作者的感觉
  • 不提倡整句引用,用你自己的话重新说明
  • 合理评价相关工作的优缺点
  • 可以综述自己前期的工作,但一般控制在 2-3 篇论文

理论部分

  • 建议重新学习《离散数学》,抄一遍其中的定义和定理
  • 严格地定义逻辑是重中之重,一般性的准则如下:

    • 理论应该完备
    • 符号要保持同一风格
    • 重要结论称为定理 theorem,定理前面打辅助的叫作引理 lemma,定理后面的尾巴叫推论 corollary,附属于算法的叫 property
  • 数学理论和定义得看个人造化

伪代码

算法伪代码是论文的核心之一
  • 需要指出算法的输入、输出
  • 方法名称可写可不写,如果被别的方法调用就必须写
  • 需要写出主要步骤的注释
  • 长度控制在 15-30 行
  • 可使用数学式子或对已有数学式子进行引用
  • 不重要的步骤尽量省略
  • 需要进行时间、空间复杂度分析,并写出相应的属性及的表格

实验部分

整篇文章的重头戏,常常占据文章一半的篇幅
  • 数据集信息

    • 数据集越多,覆盖领域也就越广,那么结果越可信
    • 数据集大些更好
    • 从主要参考文献中获取数据,有利于进行比较
    • 需要切实执行过的对比算法(代码从参考论文中获取或手动实现)
    • 同一结果不应该在图和表中同时出现
  • 自问自答模式

    • 若实验的主要目的是回答一些作者和读者关心的问题,可以采用自问自答的方式
    • 在实验之前提出这些问题
    • 在实验结果列出之后逐个回答
  • 内部比较

    • 展示参数变化所导致的性能变化.
    • 展示主要方案与其变种相比的优势
  • 外部比较

    • 需要比较经典方法,基准方法,最先进方法
    • 使用图表将对比可视化
    • 最重要的比较放在最后
    • 需要使用详尽文字进行分析描述
    • 并不需要在所有数据集上击败其它方案
    • 既要分析自己方案的优势,也要找出劣势

结论与展望

结论部分别太啰嗦,要求简短准确有力;展望部分可以适当拓展
  • 虎头豹尾,结论一般5句就够,不要太长
  • 内容不要与摘要相同
  • 可以对进一步工作进行讨论,列出 3 至 5 条。读者更关注这个部分

参考文献

注意格式,常常隐藏很多错误
  • 不要直接使用网上的bibItem
  • Latex代码中的等号对齐,保持良好的习惯
  • 名字需要有意义,不要是乱码
  • 名字在前,姓氏在后,作者姓名不要使用缩写
  • 注意题目的大小写
  • 期刊的名字按照正常方式写即可;会议名如果使用简称,就不要再写全称
  • 页码之间应使用两个连词符 -,
  • 特殊字符需要使用转义符才能正常显示
  • 查阅作者的文献了解他们的命名习惯
  • 偶尔还会根据投稿期刊的要求来进行 参考文献格式的修改

与审稿人的博弈

写论文的时候要换位思考:如果我是审稿人或读者, 我会怎么批评这篇论文?
  • 审稿人更看重哪些方面

    多数情况下,顶层视图决定是否有修改的必要,底顶视图决定如何写审稿意见
    • 顶层视图

      • 可行性:逻辑是否通顺、数据是否支持、算复杂度是否可行
      • 创新性:大的创新如新的损失函数、算法框架等;小的创新如网络结构、超参数等
      • 先进性:对数据更好的利用、 与流行方法比更好的效果、消融实验
    • 底层视图

      • 正确性:符号使用正确, 矩阵维度对上号等等
      • 完备性:理论完备
      • 一致性:符号系统一致, 与业内习惯一致
      • 规范性
      • 简洁性:定义、定理的内容尽可能简洁
  • 被拒稿的原因

    • 文字不规范:即某些语句书写语法不对或者太长
    • 实验不够充分:主要问题在于数据集不足、对比算法不充分、实验效果不明显
    • 内容不一致:即实际内容与表述的不一致,挖坑不埋,符号系统不一致
    • 理论不强:如数学表达式不正确、没有算法复杂度分析等等
    • 创新不够:一篇论文需要足够的创新点来支持,并且动机要强
  • 如何回复审稿意见

    • 端正思想态度
    • 开门见山,不要顾左右而言他
    • 回复不要太长,正文中进行相应的修改才是重点
    • 正文中修改部分应用蓝色字标出
    • 审稿人的拼写错误要帮他纠正

其他

  • 最好使用Latex编写论文,功能强大且方便格式控制。在编写时可以使用各大期刊已录用论文的源文件修改
  • 有一些单词与短语慎用在论文中,如Easy,Simple,Novel,Have’t,Don’t等
  • 如何写英文论文?

    • 借鉴法:在顶刊中找20篇论文,在各个部分找出常用句型。虽然这个方法积累起来慢,但是熟练之后,效率会大大提高
    • 倒腾法:即把中文句使用谷歌翻译软件来回翻译,直至中英句型都不再变化,再把其中的非专业词汇换成专业词汇
  • 写数学表达式时,应该先行给出一个符号表,并且不要强行给符号增加额外的特殊处理
  • 论文内图片尽量使用矢量图呈现
  • 会议论文一般没有章节组织描述、相关工作描述比较少、实验比较少、不讨论未来工作、参考文献较少(20篇左右)

Shylock_zh
53 声望2 粉丝