大家好,我是加加,今天给大家分享的是用 cursor 实现复杂创意想法。近期参加了圈子里的 cursor 培训,当了回教练,以下是我分享的那节课的主要内容,分享给初学者想要入门AI独立开发的朋友。这几乎就是逐字稿了,但是生生的让我给读成了磕磕绊绊,我这口头表达能力啊,真是太差了,我该怎么练呢?我还是比较喜欢码字,还是少说话,多码字吧。

首先,我想跟大家聊聊 AI 独立开发。

AI独立开发简介

  • 为什么要讲 AI 独立开发

    • AI 使开发更简单
      我们只需要学会如何使用 AI 工具,就可以完成很多以前需要很多工程师才能完成的工作。比如说,以前开发一个完整的网站或应用程序,可能需要前端工程师、后端工程师、数据库工程师、UI设计师等多个专业人员协作。但现在通过 AI 工具的帮助,一个人就可以扮演多个角色 - AI 可以帮我们生成界面代码、编写后端逻辑、设计数据库结构,甚至给出UI设计建议。这极大地降低了开发门槛,让个人开发者也能够独立完成规模较大的项目。
    • 独立开发者的机会
      那么随之而来的就是,这给独立开发者带来了更多的机会。整个产品开发的门槛降低了,开发周期也缩短了,这就意味着,独立开发者可以更快地推出自己的产品,测试市场反应,并根据反馈进行迭代和优化。我觉得这正好符合了马斯洛需求层次理论的第三层,自我实现的需求。我听季夏说,我们破局有很多小伙伴都希望通过 AI 编程来变现,我觉得通过独立开发来变现是一个非常好的方式。
  • AI 时代的独立开发前景和变现

    • 变现方式

      • 广告
        对于很多独立开发者来说,广告变现是最直接的方式。就是通过在产品中植入广告,然后通过广告的点击或者展示来获得收入。
      • 订阅
        订阅变现的方式,就是通过提供一些高级功能或者服务,然后用户需要付费才能使用。比如说,很多 AI 工具或者 AI 写作助手,都会提供一些高级功能,比如说,更长的生成内容长度,更快的生成速度,更准确的回答等,这些都是需要付费才能使用的。
      • 产品销售
        产品销售变现的方式,就是通过销售自己的产品来获得收入。比如说,你开发了一个有用的工具或者软件,你就可以通过销售这个产品来获得收入。
      • 培训
        培训变现的方式,就是通过培训别人来获得收入。比如说,你开发了一个有用的工具或者软件,你就可以通过培训别人来获得收入。
      • 咨询
        咨询变现的方式,就是通过提供咨询服务来获得收入。比如说,你开发了一个有用的工具或者软件,你就可以通过提供咨询服务来获得收入。最典型的就是卖课程,比如说,你开发了一个有用的工具或者软件,你就可以通过卖课程来获得收入。
  • 独立开发的诀窍-行动、积累

    • 行动

      • 工作中用到的小工具
      • 自己感兴趣的小项目
      • 解决开发中遇到的问题

这个图片展示的,就是我平时自己在工作和生活中遇到的一些小需求,我把它们做成了一个个的小工具,比如,我每周的工作周报,都是自动生成。我的公众号里面的技术文章的初稿,都是用我的这个小工具先生成,我只需要微调即可。还有一些好玩、有趣的小玩意儿,比如这个微博毒舌,我把它用于我的小号来写原创的爆文,抓取微博热点以及该热点下面的评论,让 AI 帮我整理大家的神回复,最后再形成一篇有趣的原创文章。这个 AI 之心,是前段时间 AI 之心训练营的时候,我写的一个智能体,可以根据我的主题观点和主要内容快速生成一篇风格相似的 AI 之心文章,我获得的那篇 AI 之心就有用到这个,虽然最后被老师给改的面目全非了,但那也省去了我很多的时间。

  • 积累

    • 有用的工具和库
    • 有利于成长的知识
    • 自己开发的小工具

    比如我的这些工具,都是在我封装好的一些工具集中开发的,这样,我可以更快速的完成开发,也让 cursor 省去了很多步骤,从而更高效的开发,大家很多都是程序员,应该更懂得封装的好处。

复杂产品的Cursor开发流程

找需求->需求分析->需求验证->技术选型->写文档->完成框架->完善细节->测试与调试

我想说的是,这些步骤大多数都是可以用 cursor 来辅助完成的。

  • 找需求

    • 工作中遇到的问题
    • 自己感兴趣的领域
    • 市场调研

      比如,我最近在调研一些 AI 工具,我发现很多工具都很好用,但是,他们都有一些问题,比如说,有些工具的生成速度不够快,有些工具的生成质量不够高,有些工具的生成结果不够准确,有些工具的生成结果不够多样化。所以,我就想自己开发一个工具,来解决这些问题。再比如,我会从扣子上发现一些有趣的需求,然后,我会去调研,看看有没有类似的工具,如果没有,我就会自己开发一个工具。

image.png

  • 需求分析

    用 cursor 的 chat 功能,可以帮我分析需求,给出需求分析的建议。比如,下面这个需求,就是我从扣子上发现的一个需求,然后,我用 cursor 的 chat 功能,帮我分析了这个需求,给出了需求分析的建议。

  • 需求验证

    如果是智能体的相关需求,这个可以用扣子来快速搭建一个智能体来完成,如果需求可行,然后在用 cursor 来完成开发成有趣的应用。如果是其他需求,可以用 cursor 的 compose 功能,来快速搭建一个原型,然后,用 cursor 的 chat 功能,来帮我分析这个原型,给出改进的建议。

  • 技术选型

    用 cursor 的 chat 功能,可以帮我分析技术选型的建议。比如,下面这个需求,就是我从扣子上发现的一个需求,然后,我用 cursor 的 chat 功能,帮我分析了这个需求,给出了技术选型的建议。

  • 写文档

    用 cursor 的 chat 功能,可以帮我写文档,给出文档的建议。比如,下面这个文档,就是我用 cursor 的 chat 功能,帮我写的。

  • 完成框架
    用 cursor 的 compose 功能,可以帮我完成代码框架的开发。比如,下面这个代码框架,就是我用 cursor 的 compose 功能,帮我完成的。

  • 完善细节
    用 cursor 的 compopse 功能,可以帮我完成代码细节的开发,给出代码细节的建议。比如,下面这个代码细节,就是我用 cursor 的 chat 功能,帮我完成的。

  • 测试与调试
    用 cursor 的 chat 功能,可以帮我完成代码测试与调试,给出测试与调试的建议。比如,下面这个测试与调试,就是我用 cursor 的 chat 功能,帮我完成的。 最后,很快就可以在浏览器中看到效果。

大模型 API 简介

一、什么是大模型 API

大模型 API(Application Programming Interface)是应用程序编程接口,它允许开发者将强大的大型语言模型或其他类型的大模型集成到自己的软件、应用或服务中。这些 API 就像是一座桥梁,连接着开发者和复杂的大模型技术,使开发者无需深入了解模型的内部结构和算法,就能利用模型的能力来实现各种功能。

二、大模型 API 的功能与应用

(一)自然语言处理方面

  1. 文本生成

像 GPT - 4 API,开发者可以利用它生成各种类型的文本,如故事、文章、诗歌、产品描述等。只需向 API 发送请求,指定一些参数(如提示文本、生成长度等),就能获得模型生成的高质量文本。例如,内容创作平台可以使用此类 API 为用户快速生成初稿,提高创作效率。

  1. 智能问答与对话系统

用于构建智能客服、虚拟助手等应用。大模型 API 能够理解用户的问题,并根据训练知识和算法生成准确的回答。在医疗咨询领域,智能助手可以利用 API 回答患者关于症状、治疗方法等问题;在电商领域,客服机器人可以处理常见的售前售后问题,提升客户体验。

  1. 文本摘要与翻译

能够对长篇文本进行自动摘要,提取关键信息。对于新闻媒体、学术研究等领域,可快速生成文章摘要。同时,在翻译任务中,大模型 API 也表现出色,支持多种语言之间的互译,一些 API 甚至可以处理复杂的语言结构和专业术语。

(二)图像与视频处理领域

  1. 图像创作与编辑

以腾讯云的大模型图像创作引擎 API 为例,它涵盖了图像风格化、AI 写真、模特换装、商品背景生成、线稿生图、文生图等功能。设计公司可以使用这些 API 快速生成多样化的设计方案,电商平台可以为商品图片自动更换背景或生成不同风格的展示图,动漫制作公司可以利用线稿生图功能加速制作流程。

  1. 视频创作与处理

腾讯云大模型视频创作引擎 API 提供了视频转译和视频风格化等功能。这在国际视频内容传播、短视频制作等场景中有很大的应用价值。比如,短剧出海时,通过视频转译 API 可以轻松实现语言本地化,同时保持原视频的视觉和听觉效果;视频制作公司可以利用视频风格化 API 将普通视频转换为具有特殊风格(如动漫风格、3D 动画风格)的视频,吸引更多观众。

三、大模型 API 的参数与使用

(一)常见参数

  1. 模型选择参数

不同的大模型 API 通常会提供多种模型选项。例如,在 GPT - 3.5 API 中,有不同版本或类型的模型可供选择,每个模型在生成能力、语言理解能力等方面可能有所差异。开发者需要根据应用场景和需求来确定合适的模型。

  1. 输入参数

包括输入文本(对于自然语言处理 API)、图像(对于图像相关 API)、视频(对于视频相关 API)等。对于自然语言处理 API,输入文本的质量和提示信息的准确性会影响输出结果。在图像和视频 API 中,输入的素材质量和格式也需要符合 API 的要求。

  1. 控制参数

例如温度(temperature)参数,它控制生成文本的随机性。较低的温度值会使生成的结果更保守、更确定,而较高的值则会增加随机性和创造性。在图像和视频生成 API 中,可能有类似风格强度、细节程度等控制参数。

  1. 长度参数

如 max_tokens(在自然语言处理 API 中)用于指定生成文本的最大长度,以避免生成过长或过短的内容不符合应用需求。在图像和视频 API 中,可能有分辨率、时长等类似的长度相关参数。

(二)使用步骤

  1. 注册与获取 API 密钥

一般需要在提供大模型 API 的平台上注册开发者账号,并获取 API 密钥。这是使用 API 的第一步,密钥用于身份验证和授权访问。

  1. 选择合适的开发环境和库

根据所使用的编程语言和开发平台,选择相应的 API 客户端库。这些库可以简化与 API 的交互过程,提供方便的函数和方法来发送请求和接收响应。

  1. 构建请求

根据 API 的文档,构建请求消息。这包括设置参数、输入数据等内容。例如,在使用自然语言处理 API 进行文本生成时,要设置好输入的提示文本、选择合适的模型、调整温度等参数。

  1. 发送请求与接收响应

使用 API 客户端库将构建好的请求发送到 API 服务器。服务器处理请求后,会返回相应的结果。对于自然语言处理 API,返回的可能是生成的文本;对于图像和视频 API,可能是处理后的图像或视频数据或相关的处理结果信息。

  1. 处理和展示结果

在应用程序中对 API 返回的结果进行进一步处理和展示。例如,将生成的文本显示在用户界面上,或者将处理后的图像和视频保存或播放。

四、大模型 API 的价格与市场情况

(一)价格策略

不同的大模型 API 供应商有不同的价格策略。一些像字节跳动豆包大模型在企业市场有特定的按 Tokens 计费价格,阿里云的通义千问模型 API 价格有过调整,通过降低价格来提高市场竞争力。而有的模型如智谱 AI 的 GLM - 4 - Flash 全部免费,还有部分模型为用户提供一定的免费额度,如腾讯云混元 - lite 模型有免费调用额度,火山引擎科大讯飞讯飞星火大模型也有免费额度。这些价格策略旨在满足不同用户群体的需求,吸引开发者使用。

(二)市场上的高性价比项目

市场上存在一些开源项目和免费 API 资源。例如 OneAPI 可以将不同的大模型封装成统一的 OpenAI 协议接口,支持源码部署和 Docker 部署,为开发者提供了更多的选择和灵活性。此外,像阿里云通义千问开源模型、百度智能云文心大语言模型等都为开发者提供了免费使用的机会,促进了大模型技术在更广泛领域的应用和创新。

模型名称地址
百度千帆 speed 和 lite 模型https://console.bce.baidu.com/qianfan/ais/console/onlineService
智谱 AI GLM-4-flashhttps://bigmodel.cn/console/modelcenter/square
通义千问https://help.aliyun.com/zh/model-studio/new-free-quota
腾讯混元https://console.cloud.tencent.com/hunyuan/start
coze APIhttps://www.coze.cn/docs/developer_guides/coze_api_overview
豆包大模型https://console.volcengine.com/ark/region:ark+cn-beijing/mode...

总之,大模型 API 为开发者打开了一扇通往智能应用开发的大门,无论是在自然语言处理还是图像视频创作等领域,都有着广泛的应用前景和潜力。随着技术的不断发展和市场的竞争,大模型 API 的功能将更加强大,价格也将更加合理,有望推动更多创新应用的诞生。

目前与 cursor 结合的几个比较有用的工具

下面,我将给大家介绍几个我常用到的目前与 cursor 结合的比较有用的工具。这些工具可以搭配起来使用,来完成更多复杂创意想法的实现。我会先从前段开始,然后逐渐深入到结合大模型 API 来做智能体的角度具体介绍。
那么,我会从给我们破局行动营的 AI 编程训练营来做一个官网营销落地页的案例来给大家演示这几个前端工具的用法。

  • v0

https://v0.dev
v0 这个工具使用起来非常简单,只需要在浏览器中打开,然后,就可以在浏览器中输入想要生成的网页的描述,然后,它就会根据你的描述生成一个非常漂亮的网页。

  • bolt

bolt 的优势是,它不但可以生成网页,还可以生成整个项目,也就是说,你只需要描述清楚你想要的项目,它就可以帮你生成一个完整的工程。
https://bolt.new/

  • openUI

openUI 可以理解为开源版本的 v0,它生成的效果不是很好,但是因为它是开源的,因此,你可以根据你的需求来修改它的代码,以及选用自定义的模型,来生成完成你的需求,非常适合低成本开发。这个其实我也没有太多的用过,只是知道有这么个工具,啥时候前面几个工具不想付费了,可以考虑这个。
https://openui.fly.dev/

  • vercel

这是一个非常强大的前端部署工具,可以非常方便的部署你的前端项目,而且,它还支持一键部署,非常方便。但是,它也有一个缺点,就是它部署的网站,在国内访问速度比较慢,所以,我一般会用它来部署一些静态的网页,比如,我之前用它部署了一个 AI 编程训练营的官网,效果还不错。
https://vercel.com/

  • langui

langui 这个工具,可以非常方便的完成大模型相关应用的开发,它不需要引入任何外部库,只需要复制粘贴官网里面的样例文件,就可以在你的前端项目中使用大模型各种大模型应用插件,很快一个高大上的应用就开发完成了。
https://www.langui.dev/

  • metagpt/crewAI

metagpt 和 crewAI 这两个工具,可以非常方便的完成大模型相关应用的开发,它们都是基于大模型来完成智能体的设计与开发,非常适合用来做智能体相关的应用开发。

  • streamlit

streamlit 这个工具,可以非常方便的完成大模型相关应用的开发,它非常适合用来做数据分析和可视化,非常适合用来做数据分析和可视化。

本文由mdnice多平台发布


ljl3937
1 声望0 粉丝