61 lines
4.7 KiB
Markdown
61 lines
4.7 KiB
Markdown
---
|
||
title: "Public Cloud Learning Sessions (OpenText) - Generative AI & Prompt Engineering - 20241112"
|
||
type: source
|
||
tags:
|
||
- Generative-AI
|
||
- Prompt-Engineering
|
||
- AWS
|
||
- Amazon-Bedrock
|
||
- Amazon-Q
|
||
- RAG
|
||
date: 2024-11-12
|
||
---
|
||
|
||
## Source File
|
||
- [[Cloud & DevOps/Public-Cloud-Learning-Sessions/09_Serverless_AI/public-cloud-learning-sessions-opentext-generative-ai-prompt-engineering-2024111]]
|
||
|
||
## Summary(用中文描述)
|
||
- 核心主题:AWS 云上的生成式 AI 服务生态与 Prompt Engineering 基础实践
|
||
- 问题域:企业如何在 AWS 上利用自有数据构建差异化的生成式 AI 应用
|
||
- 方法/机制:AWS Generative AI 技术栈分层(基础设施→Amazon Bedrock→应用层),RAG/Fine-tuning/持续预训练三种模型定制技术,Prompt Engineering 四大组件与基础技巧(One-shot/Few-shot/Chain-of-Thought)
|
||
- 结论/价值:数据是企业差异化关键;Bedrock 保证数据不外泄;Amazon Q 提供开箱即用的业务助手与开发者工具
|
||
|
||
## Key Claims(用中文描述)
|
||
- 生成式 AI 通过创造新体验、提升员工生产力、提取洞察、激发创造力四个维度创造商业价值
|
||
- 领域专属生成式应用的三大构建技术中,RAG 成本最低、最易实现,无需重训练即可连接多数据源
|
||
- AWS 生成式 AI 技术栈分三层:基础设施层(含 Trainium/Inferentia 专用芯片)、服务层(Amazon Bedrock)、应用层
|
||
- Amazon Bedrock 完全托管,不共享用户数据与提示词给模型提供商,并提供 Guardrails 过滤有害内容
|
||
- Prompt Engineering 是迭代过程,提示词应包含指令(Instruction)、上下文(Context)、用户输入、输出指示器四个组件
|
||
|
||
## Key Quotes
|
||
> "Your data is your differentiator and it is what makes the difference between generic application to a specific application that can actually bring business to your value." — Shikad Holtzman,阐述数据作为企业生成式 AI 差异化核心的重要性
|
||
|
||
> "None of your data nor the prompts, not the data that you are using for customizing the model is being shared with the model providers." — Bedrock 数据隐私保障声明
|
||
|
||
## Key Concepts
|
||
- [[GenerativeAI]]:能够生成新内容(文本、图像、代码等)的人工智能技术,通过创造新体验、提升生产力、提取洞察、激发创造力创造商业价值
|
||
- [[RetrievalAugmentedGeneration|RAG]](检索增强生成):连接多个数据源无需重训练模型即可构建领域专属应用,成本最低、最易实现的定制技术
|
||
- [[PromptEngineering]]:创建、设计和优化提示词以引导大语言模型响应的技术,确保输出准确性和相关性;包含 One-shot、Few-shot、Chain-of-Thought 等技巧
|
||
- [[AmazonBedrock]]:AWS 完全托管的生成式 AI 服务层,提供 Anthropic、Meta、Amazon 等多种基础模型,支持 RAG、Fine-tuning、Agents 和 Guardrails
|
||
- [[AmazonQ]]:AWS AI 助手,分为面向业务的 Amazon Q(连接多数据源进行搜索/总结/洞察提取)和面向开发者的 Amazon Q(代码生成/单元测试/代码迁移)
|
||
|
||
## Key Entities
|
||
- [[ShikadHoltzman]]:OpenText 技术客户经理(以色列),本次学习会议主讲人,分享 AWS 生成式 AI 创新机会与 Prompt Engineering 实践
|
||
- [[OpenText]]:企业信息管理公司,主办本次 Public Cloud Learning Sessions
|
||
- [[AmazonSageMaker]]:AWS 全生命周期管理服务,用于构建、训练和部署基础模型;SageMaker JumpStart 提供公开基础模型和第三方模型访问
|
||
- [[Anthropic]]:Amazon Bedrock 提供的模型提供商之一(Claude 系列)
|
||
- [[MetaAI]]:Amazon Bedrock 提供的模型提供商之一(Llama 系列)
|
||
|
||
## Connections
|
||
- [[RAG从入门到精通系列1:基础RAG]] ← related_to ← [[GenerativeAI]](RAG 是构建领域专属生成式应用的核心技术)
|
||
- [[llms-rag-ai-agent-三个到底什么区别]] ← related_to ← [[AmazonBedrock]](Bedrock 是 AWS 上 RAG 和 Agent 的主要承载平台)
|
||
- [[大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏]] ← contains ← [[PromptEngineering]](该文总结了大模型相关术语,Prompt Engineering 是重要组成部分)
|
||
- [[AmazonQ]] ← builds_on ← [[AmazonBedrock]](Amazon Q 开发者版构建于 Bedrock 之上)
|
||
|
||
## Contradictions
|
||
- 与 [[llms-rag-ai-agent-三个到底什么区别]] 可能的视角差异:
|
||
- 冲突点:RAG 是否"最容易"的定制方案
|
||
- 当前观点(RAG 最便宜最易实现,无需重训练)
|
||
- 对方观点:RAG 系统复杂度(向量数据库、检索策略、chunk 策略)可能带来运维挑战
|
||
- 注:两者均认可 RAG 的核心价值,差异在于评估维度(成本/易用性 vs. 运维复杂度)
|