张芷铭的个人博客

技术博客

#prompt工程 #LLM

技术博客

算法

你是一个专业的技术大牛,深耕【人工智能】领域多年,十分了解最新研究进展和经典方法,请以【 RLHF 】为主题,撰写一篇内容详实,知识严谨的中文技术博客。可以参考的方面包括但不限于:定义、发展、原理介绍、数学推导和性质、适用场景、使用方法,经验、最新进展、代码实现、额外推荐学习资源等,合理组织文章内容顺序和架构。

注意输出格式请遵循以下规则:
1. 如果需要使用LaTeX语法撰写公式,请遵循Obsidian编辑器的markdown实现,行内公式使用$…$包裹,行间公式使用$$…$$包裹,表达式和$符号之间不要留空格;
2. 注意引用网页链接的话,使用[]()语法添加链接;
3. 一级子标题使用一级标题语法#,以此类推,标题不添加序号。
4. 整体输出不需要添加到代码块中。

代码

你是一个专业的技术大牛,擅长各种计算机语言编程和计算机算法。深耕人工智能和Python领域多年,十分了解最新研究进展和经典的代码实现,请以【 makefile 】为主题,撰写一篇内容详实,知识严谨的【中文】技术博客。可以参考的方面包括但不限于:定义、发展、原理介绍、数学推导和性质、适用场景、使用方法,经验、最新进展、代码实现、额外推荐学习资源等,合理组织文章内容顺序和架构。

注意输出格式请遵循以下规则:
1. 如果需要使用LaTeX语法撰写公式,请遵循Obsidian编辑器的markdown实现,行内公式使用$…$包裹,行间公式使用$$…$$包裹,表达式和$符号之间不要留空格;
2. 注意引用网页链接的话,使用[]()语法添加链接;
3. 一级子标题使用一级标题语法#,以此类推,标题不添加序号。
4. 整体输出不需要添加到代码块中。

数学

你是一个专业的技术大牛和教授,深耕【数学】领域多年,十分了解最新研究进展和经典方法,并且擅长讲解和教学。请以【散度定理】为主题,撰写一篇内容详实,知识严谨的【中文】技术博客。可以参考的方面包括但不限于:定义、发展、原理介绍、数学推导和性质、适用场景、使用方法,经验、最新进展、代码、额外推荐学习资源等,合理组织文章内容顺序和架构。

注意输出格式请遵循以下规则:
1. 如果需要使用LaTeX语法撰写公式,请遵循Obsidian编辑器的markdown实现,行内公式使用$…$包裹,行间公式使用$$…$$包裹,表达式和$符号之间不要留空格;
2. 注意引用网页链接的话,使用[]()语法添加链接;
3. 一级子标题使用一级标题语法#,以此类推,标题不添加序号。
4. 整体输出不需要添加到代码块中。

解释代码

请详细解释这段代码,其中复杂的技术或者数学原理也需要解释清楚,详细解释各部分代码的意义

Gemini Prompt

你是一个专业的技术大牛,深耕【人工智能】领域多年,十分了解最新研究进展和经典方法,请以【深度学习中的位置编码原理及应用——如何设计一个位置编码算法?】为主题,撰写一篇内容详实,知识严谨的【中文】技术博客。可以参考的方面包括但不限于:定义、发展、原理介绍、数学推导和性质、适用场景、使用方法,经验、最新进展、代码、额外推荐学习资源等,合理组织文章内容顺序和架构。

注意输出格式请遵循以下规则:
1. 标题不添加序号。
2. 直接输出正文。
请帮我整理、润色和优化以下的博客内容,完善未完成的部分,使得格式规范,内容排布得当。

注意输出格式请遵循以下规则:
1. 要求使用严格的markdown语法,符合obsidian软件风格。
2. 如果有行内公式使用$…$包裹,行间公式使用$$…$$包裹;
3. 注意引用网页链接的话,使用[]()语法添加链接;
4. 一级子标题使用一级标题语法#,以此类推,标题不添加序号。
5. 整体输出不需要添加到代码块中。

阅读论文

请仔细阅读并总结文献

请仔细阅读并总结文献的以下内容: - 研究问题 - 研究方法 - 主要结论 - 创新点

请仔细的总结其数据部分,如何构造和处理。 请仔细总结模型能力

写代码

请基于“   ”的方法,实现一个“   ”的机器学习算法。
可以使用GPU加速。
同时展示在训练集和测试集上的效果。合适的话,绘制混淆矩阵、PR曲线、ROC曲线等可视化结果。
要求规范的打印和保存训练结果,各种输出的图片、文本、模型等文件,应该放在同一个output_dir目录下,注意添加os.makedirs(output_dir, exist_ok=True)以保证路径存在。
注意有关plt的绘图,图片上不可以使用中文显示,因为没有中文字体。
请给出完整代码,仔细思考需求,设计简洁优雅的代码,注释清晰。
请把以上代码改为多进程版本,保持原始作用一致,不要出错
生成HTML可视化
1
编写一个Python脚本,可以根据输入的材料,美观地用HTML排版和展示结果,注意要兼容中文。
t2v数据处理框架的相关开发
输入文件夹下,有多层文件结构(不固定是几层),但是最终数据的组织形式都是存放多组视频打包文件(一组是同名的tar文件和meta.jsonl文件,tar中包含多个mp4和同名的id文件), meta.josnl中记录文件参数(key是文件名,也是唯一标识),其中一行的key字段和mp4文件同名)

我想实现重构数据集的脚本,重构后的数据集结构依旧是tar和同名meta.jsonl文件,但可以实现以下功能:

1. 支持设置wds_files_count(一个tar包中mp4的数量)或者wds_file_size(一个tar包的文件大小)或者wds_count(输出文件夹全部tar文件数量,可以先计算输出文件夹的大小,然后除以wds_count得到每个tar的大小,尽量让每个tar包都这么大),重构的数据集, 尽量确保满足要求
2. 支持打乱数据顺序功能;可以开启或关闭;但是应该考虑到数百万条数据的打乱,如何高效实现
3. 支持用户定义特定的规则,只有当meta.josnl中的记录满足特定的要求,才提取和保留这条数据;
4. 支持删除开关,如果打开,当原本tar包中的文件全部复制转移,这个tar文件和同名的meta.jsonl文件会被删除

  

相关的超参数设置可以通过config和句点语法获取,这个我已实现。

  

因为逻辑较为复杂,建议仔细思考,在合适的地方使用生产者-消费者模型,构建合理的任务队列和结果队列,并且使用多进程提升处理速度,以适应百万条视频级别(几TB)的数据集重构。  
  
请细化代码设计方案,优化不合理的设计并写清楚功能的具体实现。请给我完整的代码。  
  
在已有代码的基础上,注意buffer也应该使用多进程来构建。可以是生产者-消费者/生产者-消费者这样的流程:  
consumer的产生的信息相当于中间的生产者,打包进程相当于消费者

领域检索

你是一位[ 人工智能机器视觉 ]领域的资深研究员,请基于【2020年以来】的最新研究,撰写一篇关于 【视频插帧 Video Frame Interpolation】 的中文学术综述。
需要包含主要技术原理和最新的前沿进展。优先引用Nature/Science/Cell或CCF-A类会议的文献,排除非同行评审内容。
你是一位[ 人工智能在医疗诊断 ]领域的首席科学家。请撰写一篇面向学术期刊的综述,全面涵盖[ 2010年以来 ]该领域的研究进展。重点包括:
1. 技术分类:医学影像分析、病理预测、药物研发中的AI模型;
2. 前沿突破:生成式AI(如Diffusion模型)、联邦学习的应用;
3. 现存挑战:数据隐私、模型可解释性、临床转化障碍。
要求:引用≥10篇顶刊文献(标注PMID),对比3类技术的优缺点(表格呈现),并提出未来5年研究方向。

论文撰写

提炼

请用中文总结提炼以上内容为一段简练的话,清楚描述其工作,适合文献综述的风格,较高完成度。忠于原始内容。遵循严格的Latex语法,注意%符号前面需要加上转义符号%

继续提炼重点,几句话说清楚工作内容,适合文献综述的风格

转写

帮我转写润色这段话,不要改变原本段落结构,保持句子整体语义和学术连贯性。按照段落和逻辑词链接,严谨成熟的论文风格。完美的latex格式。

帮我转写润色这段话,保持句子整体语义和学术连贯性。按照段落和逻辑词链接,严谨成熟的论文风格。完美的latex格式。

帮我转写这段话,保持句子整体语义和学术连贯性,使其更加贴合真实,具有可行性。段落内可以采用总-分-总等结构化的表述,尽量不要使用序号分点排列。遵循严格的Latex语法。

帮我重写润色硕士毕业论文的这部分内容,完成未完成的部分,保持整体语义和学术连贯性,审核内容的合理性和可行性,修改不可能或者矛盾的部分

帮我重写润色硕士毕业论文的这部分内容,完成未完成的部分,保持整体语义和学术连贯性,忠于原本含义审核内容的合理性和可行性,修改不可能或者矛盾的部分

  • 必要的话可以适当调整顺序和结构,使之更加有逻辑性,段落之间使用逻辑词连接,严谨的论文风格。
  • 段落内可以采用总-分-总等结构化的表述,尽量不要使用序号分点排列。如果一定要分点叙述,不要使用\item等指令,只是在每点开始前写上标号(1)(2)(3)……即可,写成一段。
  • 遵循严格的Latex语法,注意%符号前面需要加上转义符号%, 行间公式使用\equation环境,注意行内公式使用$…$包裹。
  • 如果需要绘图,仔细推理,思考绘图元素之间的关系,合理布局,格式不要出错,不要超出页面宽度。

💬 评论