为进一步适配长尾的非标仪表,系统开放了“自定义提示词”功能。本指南将说明如何借助外部大语言模型(如通义千问、Kimi、文心一言等)快速生成准确、高效的提取指令。
对于非标或结构复杂的仪表,除非你的需求十分简单,比如提取屏幕第二行数字。否则,不建议依靠人工穷举描述。推荐使用外部大语言模型辅助生成提示词。
请复制以下标准化模板,根据你的实际仪表特征填入变量,并发送给任意大语言模型。
大模型辅助生成模板(请复制并填空)
【任务背景】
你现在是一名工业视觉 AI 提示词工程师。请帮我编写一段用于“仪表读数提取”的提示词。该提示词将输入给视觉大模型,指导其从图片中准确提取数值。
【仪表特征输入】
目标数据特征:[描述你需要提取树脂情况,如:滚轮上最后一位红色的数字代表小数]
常见干扰项(需排除):[描述图片中可能影响识别的因素。如:玻璃表面有强反光;表盘上有高低压两根指针,需忽略红色的指针;周边有无关的英文字母如 m³]
【输出规范】
- 格式要求:[如:仅输出纯数字,保留两位小数;或者:输出整数]
- 限制条件:指令需简明扼要,逻辑清晰,不包含任何解释性废话,总字数严格控制在 50 字以内。
实际应用案例
读取机械滚轮数值,前四位黑色数字为整数,末位红色数字为小数。请拼接并直接输出纯数字(例:1234.5)
提取屏幕主显示区域的最大字号数值。忽略屏幕局部反光点及边缘的微小单位字符,直接输出纯数字
仅读取黑色较长指针指示的外圈刻度值,忽略红色短指针。
