Thiết kế câu lệnh là quá trình tạo câu lệnh hoặc yêu cầu bằng ngôn ngữ tự nhiên để thu thập câu trả lời chính xác, chất lượng cao từ một mô hình ngôn ngữ.
Trang này giới thiệu các khái niệm, chiến lược và phương pháp hay nhất cơ bản để giúp bạn bắt đầu thiết kế câu lệnh nhằm khai thác tối đa các mô hình AI của Gemini.
Hướng dẫn về câu lệnh theo chủ đề
Bạn đang tìm kiếm các chiến lược tạo câu lệnh cụ thể hơn? Hãy xem các hướng dẫn khác của chúng tôi về cách viết câu lệnh trên:
- Đưa ra câu lệnh bằng tệp đa phương tiện
- Đưa ra câu lệnh để tạo hình ảnh
- Đưa ra câu lệnh để tạo video
Bạn có thể tìm thấy các câu lệnh mẫu khác trong thư viện câu lệnh. Thư viện này được thiết kế để minh hoạ một cách tương tác nhiều khái niệm được chia sẻ trong hướng dẫn này.
Hướng dẫn rõ ràng và cụ thể
Một cách hiệu quả để tuỳ chỉnh hành vi của mô hình là cung cấp cho mô hình các chỉ dẫn rõ ràng và cụ thể. Hướng dẫn có thể ở dạng câu hỏi, các bước thực hiện từng nhiệm vụ hoặc phức tạp như lập bản đồ trải nghiệm và tư duy của người dùng.
Đầu vào
Đầu vào là văn bản bắt buộc trong câu lệnh mà bạn muốn mô hình đưa ra phản hồi. Đầu vào có thể là một câu hỏi mà mô hình trả lời (đầu vào câu hỏi), một tác vụ mà mô hình thực hiện (đầu vào tác vụ), một thực thể mà mô hình hoạt động (đầu vào thực thể) hoặc đầu vào một phần mà mô hình hoàn thành hoặc tiếp tục (đầu vào hoàn thành).
Loại nội dung nhập | Câu lệnh | Nội dung tạo sinh |
---|---|---|
Câu hỏi |
|
|
Việc cần làm | Give me a simple list of just the things that I must bring on a camping trip. The list should have 5 items. |
1. **Tent:** Your shelter from the elements. 2. **Sleeping Bag:** Stay warm and comfortable. 3. **Sleeping Pad:** Insulation and cushioning for a good night's sleep. 4. **Headlamp or Flashlight:** Light for nighttime activities. 5. **First Aid Kit:** Be prepared for minor injuries. |
Thực thể |
|
|
Hoàn tất một phần dữ liệu đầu vào
Mô hình ngôn ngữ tạo sinh hoạt động như một công cụ tự động hoàn thành nâng cao. Khi bạn cung cấp nội dung một phần, mô hình có thể cung cấp phần còn lại của nội dung hoặc nội dung mà mô hình cho là phần tiếp theo của nội dung đó dưới dạng câu trả lời. Khi bạn làm như vậy, nếu bạn đưa ra ví dụ hoặc bối cảnh, mô hình có thể xem xét những ví dụ hoặc bối cảnh đó.
Ví dụ sau đây cung cấp một câu lệnh có hướng dẫn và dữ liệu đầu vào là thực thể:
For the given order, return a JSON object that has the fields cheeseburger, hamburger, fries, or drink, with the value being the quantity. Order: A burger and a drink. { "cheeseburger": 0, "hamburger": 1, "fries": 0, "drink": 1 } |
Mặc dù mô hình đã thực hiện theo yêu cầu, nhưng đôi khi việc viết hướng dẫn bằng ngôn ngữ tự nhiên có thể gặp khó khăn và mô hình sẽ phải tự diễn giải rất nhiều. Ví dụ: thực đơn của nhà hàng có thể chứa nhiều món. Để giảm kích thước của phản hồi JSON, có lẽ bạn nên bỏ qua những mặt hàng chưa được đặt hàng. Trong trường hợp này, bạn có thể đưa ra một ví dụ và một tiền tố phản hồi rồi để mô hình hoàn thành câu đó:
Valid fields are cheeseburger, hamburger, fries, and drink. Order: Give me a cheeseburger and fries Output: ``` { "cheeseburger": 1, "fries": 1 } ``` Order: I want two burgers, a drink, and fries. Output: ``` { "hamburger": 2, "drink": 1, "fries": 1 } ``` |
Lưu ý cách "cheeseburger" bị loại trừ khỏi đầu ra vì không phải là một phần của đơn đặt hàng.
Giới hạn
Nêu rõ mọi hạn chế đối với việc đọc câu lệnh hoặc tạo câu trả lời. Bạn có thể cho mô hình biết những việc cần làm và không cần làm. Ví dụ: bạn có thể chỉ định một điều kiện hạn chế trong câu lệnh về thời lượng bạn muốn bản tóm tắt:
Summarize this text in one sentence: Text: A quantum computer exploits quantum mechanical phenomena to perform calculations exponentially faster than any modern traditional computer. At very tiny scales, physical matter acts as both particles and as waves, and quantum computing uses specialized hardware to leverage this behavior. The operating principles of quantum devices is beyond the scope of classical physics. When deployed at scale, quantum computers could be used in a wide variety of applications such as: in cybersecurity to break existing encryption methods while helping researchers create new ones, in meteorology to develop better weather forecasting etc. However, the current state of the art quantum computers are still largely experimental and impractical.
Exploiting quantum mechanical phenomena, quantum computers can perform calculations exponentially faster than traditional computers for potential applications like cybersecurity and meteorology, although they are currently largely experimental and impractical. |
Định dạng phản hồi
Bạn có thể đưa ra chỉ dẫn để chỉ định định dạng của câu trả lời. Ví dụ: bạn có thể yêu cầu định dạng câu trả lời dưới dạng bảng, danh sách dạng gạch đầu dòng, lời chào bán hàng ngắn gọn, từ khoá, câu hoặc đoạn văn. Chỉ dẫn hệ thống sau đây yêu cầu mô hình phản hồi theo cách trò chuyện hơn:
All questions should be answered comprehensively with details, unless the user requests a concise response specifically. What is a smart way to make a business that sells DVD's in 2025? Starting a business selling DVDs in 2025 presents significant challenges due to the overwhelming dominance of digital streaming and on-demand services; a "smart" approach would therefore require a highly specialized niche, a strong value proposition beyond just the disc, and likely a focus on community or collector markets rather than mainstream consumption. Here's a breakdown of what a smart DVD business in 2025 would likely entail: 1. Extreme Niche Specialization: You cannot compete with streaming libraries. Your business must focus on what digital doesn't offer easily or at all. This could include: * Out-of-Print & Rare Titles: Sourcing films or TV shows that have never been released digitally or are currently unavailable on major streaming platforms. .... |
Định dạng câu trả lời bằng chiến lược hoàn tất
Chiến lược hoàn thành cũng có thể giúp định dạng câu trả lời. Ví dụ sau đây nhắc mô hình tạo dàn ý cho bài luận:
Create an outline for an essay about hummingbirds. Here is a possible outline for an essay about hummingbirds: I. Introduction A. Hook: Start with a captivating fact or description about hummingbirds (e.g., their speed, iridescent colors, or tiny size). B. Background: Briefly introduce hummingbirds – where they are found (Americas), their reputation as unique birds. C. Thesis Statement: State the main point of the essay, which could be about the remarkable adaptations, behaviors, and ecological importance of hummingbirds. II. Appearance and Identification ..... |
Câu lệnh không chỉ định định dạng cho dàn ý và mô hình đã chọn một định dạng cho bạn. Để mô hình trả về dàn ý ở một định dạng cụ thể, bạn có thể thêm văn bản đại diện cho phần đầu của dàn ý và để mô hình hoàn tất dàn ý đó dựa trên mẫu mà bạn đã bắt đầu.
Create an outline for an essay about hummingbirds. I. Introduction * Okay, here is an outline for an essay about hummingbirds, starting from the introduction you provided: I. Introduction * Hook: Start with a captivating fact or description about hummingbirds (e.g., their speed, iridescent colors, or tiny size). * Background: Briefly introduce hummingbirds – where they are found (Americas), their reputation as unique birds, and their general characteristics. * Thesis Statement: State the main point of the essay, focusing on the remarkable adaptations, behaviors, and ecological significance that make hummingbirds extraordinary. ..... |
Câu lệnh không có ví dụ so với câu lệnh có một vài ví dụ
Bạn có thể đưa ví dụ vào câu lệnh để cho mô hình biết thế nào là làm đúng. Mô hình này cố gắng xác định các mẫu và mối quan hệ từ các ví dụ, đồng thời áp dụng chúng khi tạo câu trả lời. Những câu lệnh có chứa một vài ví dụ được gọi là câu lệnh dựa trên một vài ví dụ, trong khi những câu lệnh không cung cấp ví dụ nào được gọi là câu lệnh dựa trên không có ví dụ. Câu lệnh ít mẫu thường được dùng để điều chỉnh định dạng, cách diễn đạt, phạm vi hoặc mẫu chung của các câu trả lời của mô hình. Sử dụng các ví dụ cụ thể và đa dạng để giúp mô hình thu hẹp phạm vi và tạo ra kết quả chính xác hơn.
Bạn nên luôn đưa một vài ví dụ về few-shot vào câu lệnh. Câu lệnh không có ví dụ ít lần có thể sẽ kém hiệu quả hơn. Trên thực tế, bạn có thể xoá hướng dẫn khỏi câu lệnh nếu các ví dụ của bạn đủ rõ ràng để cho thấy nhiệm vụ cần thực hiện.
Lời nhắc không cần ví dụ sau đây yêu cầu mô hình chọn lời giải thích phù hợp nhất.
Please choose the best explanation to the question: Question: How is snow formed? Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the atmosphere, which can combine and grow into snowflakes as they fall through the atmosphere and accumulate on the ground. Explanation2: Water vapor freezes into ice crystals forming snow. Answer: Explanation1 is the better explanation because it provides more detail on the process, including how ice crystals combine and grow into snowflakes as they fall through the atmosphere. |
Nếu trường hợp sử dụng của bạn yêu cầu mô hình tạo ra các câu trả lời ngắn gọn, bạn có thể đưa các ví dụ vào câu lệnh để ưu tiên các câu trả lời ngắn gọn.
Câu lệnh sau đây cung cấp 2 ví dụ cho thấy sự ưu tiên đối với lời giải thích ngắn gọn hơn. Trong câu trả lời, bạn có thể thấy rằng các ví dụ đã hướng dẫn mô hình chọn lời giải thích ngắn hơn (Explanation2
) thay vì lời giải thích dài hơn (Explanation1
) như trước đây.
Below are some examples showing a question, explanation, and answer format: Question: Why is the sky blue? Explanation1: The sky appears blue because of Rayleigh scattering, which causes shorter blue wavelengths of light to be scattered more easily than longer red wavelengths, making the sky look blue. Explanation2: Due to Rayleigh scattering effect. Answer: Explanation2 Question: What is the cause of earthquakes? Explanation1: Sudden release of energy in the Earth's crust. Explanation2: Earthquakes happen when tectonic plates suddenly slip or break apart, causing a release of energy that creates seismic waves that can shake the ground and cause damage. Answer: Explanation1 Now, Answer the following question given the example formats above: Question: How is snow formed? Explanation1: Snow is formed when water vapor in the air freezes into ice crystals in the atmosphere, which can combine and grow into snowflakes as they fall through the atmosphere and accumulate on the ground. Explanation2: Water vapor freezes into ice crystals forming snow. Answer: Answer: Explanation2 |
Số lượng ví dụ tối ưu
Các mô hình như Gemini thường có thể nhận ra các mẫu chỉ bằng một vài ví dụ, mặc dù bạn có thể cần thử nghiệm với số lượng ví dụ cần cung cấp trong câu lệnh để đạt được kết quả tốt nhất. Đồng thời, nếu bạn đưa vào quá nhiều ví dụ, mô hình có thể bắt đầu khớp quá mức phản hồi với các ví dụ.
Mẫu và phản mẫu
Việc sử dụng các ví dụ để cho mô hình thấy một mẫu cần tuân theo sẽ hiệu quả hơn so với việc sử dụng các ví dụ để cho mô hình thấy một mẫu cần tránh.
⛔ Mẫu tiêu cực:
Don't end haikus with a question: Haiku are fun A short and simple poem Don't you enjoy them? |
✅ Mẫu tích cực:
Always end haikus with an assertion: Haiku are fun A short and simple poem A joy to write |
Định dạng nhất quán
Đảm bảo rằng cấu trúc và định dạng của các ví dụ ít lần đều giống nhau để tránh các câu trả lời có định dạng không mong muốn. Một trong những mục tiêu chính của việc thêm ví dụ ít lần vào câu lệnh là cho mô hình thấy định dạng phản hồi. Do đó, bạn cần đảm bảo định dạng nhất quán trên tất cả các ví dụ, đặc biệt là chú ý đến thẻ XML, khoảng trắng, dòng mới và dấu phân cách ví dụ.
Thêm bối cảnh
Bạn có thể đưa ra hướng dẫn và thông tin trong một câu lệnh mà mô hình cần để giải quyết vấn đề, thay vì giả định rằng mô hình có tất cả thông tin cần thiết. Thông tin theo bối cảnh này giúp mô hình hiểu được các ràng buộc và chi tiết về những việc bạn yêu cầu mô hình thực hiện.
Ví dụ sau đây yêu cầu mô hình đưa ra hướng dẫn khắc phục sự cố cho một bộ định tuyến:
What should I do to fix my disconnected wifi? The light on my Google Wifi router is yellow and blinking slowly. A yellow blinking light on your Google Wifi router usually indicates a problem with the internet connection. Here are some steps to troubleshoot and fix the issue: 1. Restart your router and modem: - Unplug your modem from the power outlet and wait for 30 seconds. - Plug your modem back in and wait for it to fully boot up. - Unplug your Google Wifi router and wait for 30 seconds. - Plug your Google Wifi router back in and wait for it to fully boot up. ..... |
Câu trả lời có vẻ là thông tin khắc phục sự cố chung, không cụ thể cho bộ định tuyến hoặc trạng thái của đèn chỉ báo LED.
Để tuỳ chỉnh câu trả lời cho bộ định tuyến cụ thể, bạn có thể thêm hướng dẫn khắc phục sự cố của bộ định tuyến vào câu lệnh dưới dạng ngữ cảnh để bộ định tuyến tham khảo khi đưa ra câu trả lời.
Answer the question using the text below. Respond with only the text provided. Question: What should I do to fix my disconnected wifi? The light on my Google Wifi router is yellow and blinking slowly. Text: Color: Slowly pulsing yellow What it means: There is a network error. What to do: Check that the Ethernet cable is connected to both your router and your modem and both devices are turned on. You might need to unplug and plug in each device again. Color: Fast blinking yellow What it means: You are holding down the reset button and are factory resetting this device. What to do: If you keep holding down the reset button, after about 12 seconds, the light will turn solid yellow. Once it is solid yellow, let go of the factory reset button. Color: Solid yellow What it means: Router is factory resetting. What to do: This can take up to 10 minutes. When it's done, the device will reset itself and start pulsing white, letting you know it's ready for setup. Color: Solid red What it means: Something is wrong. What to do: Critical failure. Factory reset the router. If the light stays red, contact Wifi customer support. Check that the Ethernet cable is connected to both your router and your modem and both devices are turned on. You might need to unplug and plug in each device again. |
Thêm tiền tố
Tiền tố là một từ hoặc cụm từ mà bạn thêm vào nội dung câu lệnh. Tiền tố có thể phục vụ nhiều mục đích, tuỳ thuộc vào vị trí bạn đặt tiền tố:
- Tiền tố đầu vào: Thêm tiền tố vào các phần có ý nghĩa về mặt ngữ nghĩa của tín hiệu đầu vào cho mô hình. Ví dụ: tiền tố "Tiếng Anh:" và "Tiếng Pháp:" phân định hai ngôn ngữ khác nhau.
- Tiền tố đầu ra: Mặc dù đầu ra do mô hình tạo, nhưng bạn có thể thêm tiền tố cho đầu ra trong câu lệnh. Tiền tố đầu ra cung cấp cho mô hình thông tin về nội dung dự kiến sẽ xuất hiện dưới dạng câu trả lời. Ví dụ: tiền tố đầu ra "JSON:" báo hiệu cho mô hình rằng đầu ra phải ở định dạng JSON.
- Ví dụ về tiền tố: Trong câu lệnh ít mẫu, việc thêm tiền tố vào các ví dụ sẽ cung cấp nhãn mà mô hình có thể dùng khi tạo đầu ra, giúp bạn dễ dàng phân tích cú pháp nội dung đầu ra.
Trong ví dụ sau, "Văn bản:" là tiền tố đầu vào và "Câu trả lời là:" là tiền tố đầu ra.
Classify the text as one of the following categories. - large - small Text: Rhino The answer is: large Text: Mouse The answer is: small Text: Snail The answer is: small Text: Elephant The answer is: The answer is: large |
Chia câu lệnh thành các thành phần
Đối với những trường hợp sử dụng đòi hỏi câu lệnh phức tạp, bạn có thể giúp mô hình quản lý độ phức tạp này bằng cách chia nhỏ mọi thứ thành các thành phần đơn giản hơn.
Chia nhỏ hướng dẫn: Thay vì đưa ra nhiều hướng dẫn trong một câu lệnh, hãy tạo một câu lệnh cho mỗi hướng dẫn. Bạn có thể chọn lời nhắc cần xử lý dựa trên thông tin đầu vào của người dùng.
Chuỗi câu lệnh: Đối với những tác vụ phức tạp liên quan đến nhiều bước tuần tự, hãy tạo một câu lệnh cho mỗi bước và liên kết các câu lệnh với nhau theo trình tự. Trong chuỗi lời nhắc tuần tự này, đầu ra của một lời nhắc trong chuỗi sẽ trở thành đầu vào của lời nhắc tiếp theo. Đầu ra của câu lệnh cuối cùng trong chuỗi là đầu ra cuối cùng.
Tổng hợp các phản hồi: Tổng hợp là khi bạn muốn thực hiện nhiều tác vụ song song trên nhiều phần dữ liệu và tổng hợp kết quả để tạo ra đầu ra cuối cùng. Ví dụ: bạn có thể yêu cầu mô hình thực hiện một thao tác trên phần đầu tiên của dữ liệu, thực hiện một thao tác khác trên phần còn lại của dữ liệu và tổng hợp kết quả.
Thử nghiệm với các tham số mô hình
Mỗi lệnh gọi mà bạn gửi đến một mô hình đều bao gồm các giá trị tham số kiểm soát cách mô hình tạo ra phản hồi. Mô hình có thể tạo ra các kết quả khác nhau cho các giá trị tham số khác nhau. Hãy thử nghiệm với nhiều giá trị tham số để nhận được các giá trị tốt nhất cho tác vụ. Các tham số có sẵn cho các mô hình khác nhau có thể khác nhau. Sau đây là các tham số phổ biến nhất:
Số lượng mã thông báo đầu ra tối đa: Chỉ định số lượng mã thông báo tối đa có thể được tạo trong câu trả lời. Một mã thông báo có khoảng 4 ký tự. 100 mã thông báo tương ứng với khoảng 60 đến 80 từ.
Nhiệt độ: Nhiệt độ kiểm soát mức độ ngẫu nhiên trong việc chọn mã thông báo. Nhiệt độ được dùng để lấy mẫu trong quá trình tạo phản hồi, xảy ra khi
topP
vàtopK
được áp dụng. Nhiệt độ thấp phù hợp với những câu lệnh yêu cầu câu trả lời mang tính xác định hơn hoặc ít mang tính mở hơn, trong khi nhiệt độ cao có thể dẫn đến kết quả đa dạng hoặc sáng tạo hơn. Nhiệt độ 0 là xác định, tức là phản hồi có xác suất cao nhất luôn được chọn.topK
: Tham sốtopK
thay đổi cách mô hình chọn mã thông báo cho đầu ra.topK
bằng 1 có nghĩa là mã thông báo được chọn có khả năng xuất hiện cao nhất trong số tất cả mã thông báo trong từ vựng của mô hình (còn gọi là giải mã tham lam), trong khitopK
bằng 3 có nghĩa là mã thông báo tiếp theo được chọn trong số 3 mã thông báo có khả năng xuất hiện cao nhất bằng cách sử dụng nhiệt độ. Đối với mỗi bước chọn mã thông báo, các mã thông báotopK
có xác suất cao nhất sẽ được lấy mẫu. Sau đó, các mã thông báo sẽ được lọc thêm dựa trêntopP
, mã thông báo cuối cùng được chọn bằng cách sử dụng phương pháp lấy mẫu nhiệt độ.topP
: Tham sốtopP
thay đổi cách mô hình chọn mã thông báo cho đầu ra. Các mã thông báo được chọn từ mã thông báo có xác suất cao nhất đến thấp nhất cho đến khi tổng xác suất của chúng bằng giá trịtopP
. Ví dụ: nếu các mã thông báo A, B và C có xác suất lần lượt là 0,3, 0,2 và 0,1, đồng thời giá trịtopP
là 0,5, thì mô hình sẽ chọn A hoặc B làm mã thông báo tiếp theo bằng cách sử dụng nhiệt độ và loại trừ C làm ứng cử viên. Giá trịtopP
mặc định là 0,95.stop_sequences
: Đặt một chuỗi dừng để yêu cầu mô hình dừng tạo nội dung. Một chuỗi dừng có thể là bất kỳ chuỗi ký tự nào. Cố gắng tránh sử dụng một chuỗi ký tự có thể xuất hiện trong nội dung được tạo.
Chiến lược ra lệnh nối tiếp
Đôi khi, bạn cần thiết kế câu lệnh nhiều lần trước khi nhận được câu trả lời mà bạn mong muốn một cách nhất quán. Phần này hướng dẫn một số việc bạn có thể thử khi lặp lại các câu lệnh:
Sử dụng cách diễn đạt khác: Việc sử dụng các từ hoặc cách diễn đạt khác nhau trong câu lệnh thường mang lại các câu trả lời khác nhau từ mô hình, mặc dù tất cả đều có cùng một ý nghĩa. Nếu bạn không nhận được kết quả như mong đợi từ câu lệnh, hãy thử diễn đạt lại câu lệnh đó.
Version 1: How do I bake a pie? Version 2: Suggest a recipe for a pie. Version 3: What's a good pie recipe?
Chuyển sang một nhiệm vụ tương tự: Nếu bạn không thể khiến mô hình làm theo hướng dẫn của bạn cho một nhiệm vụ, hãy thử đưa ra hướng dẫn cho một nhiệm vụ tương tự để đạt được kết quả tương tự.
Câu lệnh này yêu cầu mô hình phân loại một cuốn sách bằng cách sử dụng các danh mục được xác định trước:
Which category does The Odyssey belong to: thriller sci-fi mythology biography
The Odyssey belongs to the category of **mythology**. Here's why: * **Mythology:** The Odyssey tells the story of Odysseus, a hero from Greek mythology, and his journey home after the Trojan War. It features gods, monsters, and supernatural events common to Greek mythology. .....
Câu trả lời là chính xác, nhưng mô hình không nằm trong phạm vi của các lựa chọn. Bạn cũng muốn mô hình chỉ phản hồi bằng một trong các lựa chọn thay vì bằng một câu hoàn chỉnh. Trong trường hợp này, bạn có thể diễn đạt lại hướng dẫn dưới dạng câu hỏi trắc nghiệm và yêu cầu mô hình chọn một phương án.
Multiple choice problem: Which of the following options describes the book The Odyssey? Options:
- thriller
- sci-fi
- mythology
- biography
The correct answer is mythology.
Thay đổi thứ tự nội dung trong câu lệnh: Đôi khi, thứ tự của nội dung trong câu lệnh có thể ảnh hưởng đến câu trả lời. Hãy thử thay đổi thứ tự nội dung và xem điều đó ảnh hưởng đến câu trả lời như thế nào.
Version 1: [examples] [context] [input] Version 2: [input] [examples] [context] Version 3: [examples] [input] [context]
Phản hồi dự phòng
Phản hồi dự phòng là phản hồi do mô hình trả về khi câu lệnh hoặc câu trả lời kích hoạt bộ lọc an toàn. Ví dụ về câu trả lời dự phòng là "Tôi không thể giúp bạn về vấn đề đó vì tôi chỉ là một mô hình ngôn ngữ."
Nếu mô hình phản hồi bằng một câu trả lời dự phòng, hãy thử tăng nhiệt độ.
Những điều nên tránh
- Tránh dựa vào các mô hình để tạo thông tin thực tế.
- Hãy sử dụng một cách cẩn thận đối với các bài toán và vấn đề logic.
Tìm hiểu sâu về các mô hình tạo sinh
Phần này nhằm trả lời câu hỏi: Các câu trả lời của mô hình tạo sinh có ngẫu nhiên hay không?
Câu trả lời ngắn gọn là có. Khi bạn đưa ra câu lệnh cho một mô hình tạo sinh, câu trả lời dạng văn bản sẽ được tạo theo hai giai đoạn. Ở giai đoạn đầu tiên, mô hình tạo sinh sẽ xử lý câu lệnh đầu vào và tạo ra một phân phối xác suất trên các mã thông báo (từ) có thể xuất hiện tiếp theo. Ví dụ: nếu bạn nhắc bằng văn bản đầu vào "Chú chó nhảy qua ... ", mô hình tạo sinh sẽ tạo ra một mảng các từ có thể xuất hiện tiếp theo:
[("fence", 0.77), ("ledge", 0.12), ("blanket", 0.03), ...]
Quá trình này mang tính xác định; một mô hình tạo sinh sẽ tạo ra cùng một bản phân phối này mỗi khi nhận được cùng một văn bản lời nhắc.
Ở giai đoạn thứ hai, mô hình tạo sinh sẽ chuyển đổi các bản phân phối này thành phản hồi bằng văn bản thực tế thông qua một trong số các chiến lược giải mã. Một chiến lược giải mã đơn giản có thể chọn mã thông báo có khả năng xảy ra nhất ở mọi bước thời gian. Quá trình này sẽ luôn mang tính xác định. Tuy nhiên, bạn có thể chọn tạo phản hồi bằng cách lấy mẫu ngẫu nhiên trên bản phân phối do mô hình trả về. Quá trình này sẽ là ngẫu nhiên. Kiểm soát mức độ ngẫu nhiên được phép trong quá trình giải mã này bằng cách đặt nhiệt độ. Nhiệt độ 0 có nghĩa là chỉ những mã thông báo có khả năng xuất hiện cao nhất được chọn và không có tính ngẫu nhiên. Ngược lại, nhiệt độ cao sẽ đưa mức độ ngẫu nhiên cao vào các mã thông báo mà mô hình chọn, dẫn đến các phản hồi bất ngờ hơn của mô hình.
Các bước tiếp theo
- Giờ đây, bạn đã hiểu rõ hơn về cách thiết kế câu lệnh, hãy thử viết câu lệnh của riêng bạn bằng Google AI Studio.
- Để tìm hiểu về câu lệnh đa phương thức, hãy xem bài viết Đưa ra câu lệnh bằng tệp đa phương tiện.
- Để tìm hiểu về câu lệnh về hình ảnh, hãy xem hướng dẫn về câu lệnh cho Imagen
- Để tìm hiểu về câu lệnh tạo video, hãy xem hướng dẫn về câu lệnh cho Veo