数学建模比赛技巧
本文最后更新于:4 个月前
突击一下数学建模比赛技巧,关于MATLAB的部分还没写完
数学建模
技巧
搜索
- 完全匹配 在查询词外边加上双引号””,避免关键字被拆分
- 标题必含关键字,查询词前加上intitle:
- 搜索文档,在查询词后空格再输入filetype:文件格式
- 去掉不想要的,查询词后空格加减号与关键字
查文献
先看知网的硕博士论文,会对研究的问题又详细的背景和基础知识的介绍,帮助我们快速理解题目。
按照“被引”排序
高级检索:例如想了解神经网络在信贷策略中的应用
主题为:企业信贷 OR主题为:信贷决策 AND关键词:神经网络,词频设置为“模糊”
谷歌学术镜像_Google镜像站 (scqylaw.com)
国赛没必要去外网找文献
找数据
有些赛题需要自己找数据
- 优先在知网、谷歌学术等平台搜索
- 国家数据 (stats.gov.cn)
- EPSDATA官网 (epsnet.com.cn)
数据预处理
缺失值
- 比赛提供的数据,发现有些单元格是null或空
- 缺失太多:例如人口信息,发现“年龄”一项缺失了40%,直接把该指标删除
- 最简单的处理:均值、众数插补,适用统计数据,对个体精度要求不大
- 定量数据,例如一群人的身高、年龄等数据,用整体的均值来补缺失
- 定性数据,例如关于一群人的性别、文化程度;某些事件调查的满意度,用出现次数最多的值补缺失
- Newton插值法:热力学温度、地形测量、定位等只追求函数值精确而不关心变化数据
- 缺点:区间边缘处的不稳定震荡,不适合对导数有要求的题
- 做法:根据固定公式,构造近似函数,补上缺失值,普遍适用性强
- 样条插值法:零件加工,水库水流量,图像“基线漂移”,机器人轨迹等精度要求高,没有突变的数据
- 用分段光滑的曲线去插值
异常值
比如一群人的身高值数据中出现一个3米2的数据
找出异常值:
- 正态分布3σ原则,数据出现在$(\mu-3\sigma,\mu+3\sigma)$中的概率为99.73%,数值出现在外则为异常值
- 适用符合正态分布,人口数据、测量误差、加工质量、考试成绩
- 画箱型图,数据从小到大排列,下四分数Q1排25%的数值,同理找到上四分数Q3,$IQR=Q3-Q1$,设置一个合理区间$[Q1-1.5IQR,Q3+1.5IQR]$在区间外的就是异常值
- 普遍适用
找出异常后,处理方法与处理缺失值相同,删除异常值,填充缺失值
建模全过程
什么是模型
- 有理论基础
- 有推导过程
- 有最终结论
- 以文字描述、数学公式、图像表格展现出来
三天时间,以本科生实力不可能发明出一种模型
整篇论文,很多思路、模型等都是从参考文献和书籍中搬过来的
- 比赛开始后先查文献,一切以现有的他人成果为基础
- 看不懂原理没关系,把论文“编“出来就行
建模过程
一篇完整的论文
- 包括==摘要==(最重要)、问题重述、模型假设和符号说明、模型建立与求解(最长)、模型的优缺点与改进方法、参考文献与附录
==摘要==
- 读者看完摘要,就知道论文研究的问题、用了什么方法、求得了什么结果以及每一部分的大致步骤
- 摘要决定了评委老师的第一印象,决定了论文大致打分
问题重述
- 将题目简述一遍即可,不要直接复制,可以复制下来后改句子
模型假设和符号说明
- 好的假设能事半功倍
- 例如某一年太阳投影问题,影子长度与地球公转也有关系,但地球公转对影长的影响远远小于自转,可以在模型假设里说明”忽略公转对影长的影响“
- 符号说明将论文中定义的重要符号列出表格说明即可(整篇论文多次用到的变量)
模型的建立
一组公式,和对公式中每个变量的解释,就是一个模型
先查阅资料,看着资料,用自己的话去复述一个简单的模型,再根据题目中的约束条件去一步步修改模型,把题目中的变量带入模型中去
模型求解
模型的求解过程可以把资料上的用自己的话复述一遍,代码需要放在附录中,但是解释需要概况放word,举例:
必须根据赛题解释清楚“起始点”在本问题中究竟是什么、算法中的变量在题目中的意义是什么、最短路径意味着什么
不同小问
- 并不是针对题目的每一问都要建立一个模型
- 如果每小问之间具有相似性、仅仅增加了约束条件,完全可以全文建立一个模型,针对每一小问进行改进。
模型的优缺点与改进方法
- 不是必须的,可以简单分析优缺点,若没有改进方法也可以不写
- 结合查到的文献,分析正文中模型常用在什么哪种问题,又与本文所求解的问题有何区别
参考文献
格式一定要规范
知网检索结果右侧有引用按钮,打开后复制即可,比赛用第一个即可
附录
- 正文中求解时用到的的代码
- 不要用网上搜到的代码,把查到的代码变量名换一换
论文排版
论文整体排版
颜值即正义
各级标题与正文层次分明
- 一般标题级别不超过三级
- 正文中字体设置宋体、英文
Times New Roman
正文排版紧凑,看起来充实,没有大片空白
- 避免图片过大导致出现大片空白,且不要留空行
表格与图片
- 表格用标准的三线表
- 表的标题放在表的上方,图名放在图的下放
公式编辑
- 推荐
mathpix
但是收费,也可以用word
公式编辑器 - 公式需要解释清楚每个变量的意义;重要的公式后面带有编号
- 推荐
避免问题
摘要该分段分段,避免段落字数过多,尽量不出现公式
符号说明可以用三线表表格
标题
基于xxx模型的xxx问题研究
- 读完标题能知道文本建的是什么模型
- 简明扼要、符合规范、便于检索
- 尽量使用大家都知道的词语
- 避免出现公式、非公知公用的缩写(比如:VGG16)
- 字数一行
- 基于xxx模型/算法的xxx问题研究
- xxx模型就是正文里的核心模型
- xxx问题就是赛题的中心词
- 不要使用过多的修饰词
写好摘要,非常重要
摘要是论文的概况总结
让评阅老师读完摘要,就知道本文解决的问题,建立的模型和求解结果
- 放求解结果不要放结果图和表格,文字描述即可
- 控制在3/4页到一页,字数大约800-1100
开头
- 开头段模板:本文主要研究了XXX问题。根据XXX,利用XXX模型/方法,求解出XXX。
- 第一句:说清研究的问题
- 第二句:说清全文采用的模型/算法、采取的操作
- 开头段不要写详细的求解结果
针对问题一、二、三
- 中间段模板:针对问题一,考虑/根据XXX,…..,建立XXX模型/利用XXX方法,…求解出XXX。
- 一定要写清结果!!!
- 优化类、预测类和物理类的题目,要明确写清数值
- 要求提供建议或评价的题目,写要明确写清结论和数据依据,但不要有表格;数据过多可以说明数据见附录
总结
可有可无
- 摘要字数不够,可以加上
- 不要累赘重复前面的内容
- 写一些文本的特色、自夸的语句
关键词
- 一般4-6个
- 使用的模型和算法、大家都知道的专业名词、问题的关键词
- 中间以空格分开
参考文献
- 引用文献或公开资料都必须按规范列出参考文献并在正文对应处标注
- 文献直接搜索文献后引用导出即可
- 删除首行缩进,按照正文出现次序标号
- 正文添加右上角角标,写出[1],选择后点击开始-字体-上标
公式编辑
- Word自带公式编辑(适合小白)
- “插入-公式”
- Mathpix(付费)
- 截图即可得到公式
- AxMath(付费)
- 支持快捷键+Tex代码+按钮三者混合输入
- 排版和编号方便
利用表格自动编号
- Word中插入一行两列的表格
- 左端插入公式,右端插入域代码,最后隐藏表格线
- 设计好后把表格复制粘贴,改掉公式即可,编号会自动更新
三线表
- 表格第一行的上下设置横线,最后一行的下端设置横线
- 表的标题写在表的上方,且带有序号
- 写表的标题时,采用“插入题注”,表的序号会自动更新
- 选择表格后,右键点击表格设计工具栏的样式,修改表格样式
- 选择将样式应用于“整个表格”,先选择无框线,再选择上框线和下框线
- 设置“格式-表格属性-居中”;表格内设置“表格布局-对齐方式-水平居中对齐”
- 选择将样式应用于“标题行”,选择下框线
图片绘制
“美术建模”
- 基本要求
- 显示思路,形象地展现结果,提高逼格
- 图地标题要放在下放,且带有编号
- 注意排版,要无首行缩进,居中对齐
- 常见作图软件
- 最简单:PPT、Excle、AxGlyph、Origin、visio
- 编程类:Python、MATLAB、SPSS
- 专业类:COMSOL(物理)、CAD(工程制图)、MapInfo(地理信息)
- 非学术类:ProcessOn、亿图、Xmind
- 万能神器:ECharts,由JavaScript实现地开源可视化库,功能齐全
- 如果做不出来图,就不要刻意作图了
- 流程图、思路图:Excel、PPT、Xmind等
- 函数关系图:MATLAB、AxGlyph、Origin等,注意不同曲线颜色不一样
- 整体背景白底黑线
- 物理示意图(没必要):PPT、MATLAB、AxGlyph等
- 地理空间图:Echarts、MapInfo等
分页符
摘要页末尾要使用分页符
- 保证摘要页始终只有摘要、无论怎么修改,后面地内容不会到前面来
- Word功能区地“插入-分页”
MATLAB
界面与基本操作
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载先请联系作者且注明出处!