核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
如何看待伊朗媒体称「今晚将发生世界铭记的大事」?可能是什么?
瑜伽体式的乐趣是什么?
买到烂尾楼到底该有多绝望?
UBI(Universal basic income,全民基本收入)可行吗?
自己拥有一台服务器可以做哪些很酷的事情?
5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何?
为什么供应链桃子只有小米雷军可以摘,其他人只能干瞪眼?
你做过最抽象的事情是什么?
导师给了1.4W要我给工作室买个主机,是整机还是自己配?
「韦东奕本人」账号确认是***的,目前已被关停,如何看待无底线博流量的行为?哪些信息值得关注?
电话:
座机:
邮箱:
地址: