Cách viết prompt Veo 3.1 hoàn hảo: Hướng dẫn dành cho người mới bắt đầu

Trang chủ » Bài viết » Cách viết prompt Veo 3.1 hoàn hảo: Hướng dẫn dành cho người mới bắt đầu

Bạn đã có ý tưởng tuyệt vời cho một video. Nhưng có một thách thức: bạn không biết cách viết một đoạn mã Veo 3.1 để tạo ra video chính xác như bạn tưởng tượng.

Đây là điểm mà hầu hết các nhà sáng tạo đều mắc kẹt. Vấn đề không phải là thiếu sáng tạo. Vấn đề là không biết cách truyền đạt ý tưởng của mình đến AI. Một lời nhắc như “một người đang đi bộ” sẽ dẫn đến một đoạn clip nhạt nhẽo, dễ quên. Một lời nhắc rõ ràng, chi tiết sẽ mang đến cho bạn một khoảnh khắc điện ảnh chân thực và trau chuốt.

Sự thật là: Chất lượng video AI phụ thuộc 80% vào tốc độ và 20% vào mô hình. Bạn có thể sử dụng công nghệ tốt nhất hiện có, nhưng nếu tốc độ của bạn yếu, video của bạn cũng sẽ yếu theo.

Veo 3.1 cung cấp cho bạn hai cách sáng tạo khác nhau. Chuyển văn bản thành video xây dựng mọi thứ từ đầu. Chuyển hình ảnh thành video làm động những gì bạn đã có.

Mỗi loại cần một phong cách gợi ý khác nhau. Trộn lẫn chúng với nhau, kết quả sẽ không nhất quán.

Hướng dẫn này cung cấp cho bạn một cấu trúc rõ ràng, đơn giản để viết các lệnh Veo 3.1 cho cả hai phương pháp. Bạn sẽ được xem các ví dụ, tìm hiểu logic đằng sau cấu trúc và nhận các mẫu có thể sử dụng ngay.

Chúng ta hãy bắt đầu nhé.

Điểm khác biệt của Veo 3.1 Prompts là gì?

Nếu bạn đã sử dụng Veo 3 trước đây, bạn có thể thắc mắc liệu Veo 3.1 có yêu cầu phong cách viết mới không.

Câu trả lời ngắn gọn là: không hẳn vậy.

Cấu trúc vẫn vậy — nhưng mô hình thông minh hơn, chính xác hơn và có nhiều khả năng hơn. Sau đây là những thay đổi.

Hiểu bạn hơn

Veo 3.1 hiểu chi tiết chính xác hơn. Nếu bạn mô tả một chuyển động camera cụ thể, chẳng hạn như một cú dolly chậm vào mặt nhân vật, Veo 3.1 sẽ bám sát hướng dẫn đó. Veo 3 thường bám sát; Veo 3.1 luôn đạt được mục tiêu một cách nhất quán.

Âm thanh rõ ràng hơn, tự nhiên hơn

Cả Veo 3 và Veo 3.1 đều hỗ trợ âm thanh. Nhưng Veo 3.1 tạo ra lời thoại sắc nét hơn và âm thanh môi trường chân thực hơn. Giọng nói nghe như thật. Các hiệu ứng như tiếng mưa hay tiếng bước chân tạo cảm giác chân thực và sống động.

Bạn có thể làm nhiều hơn

Veo 3.1 cho phép bạn xây dựng các chuỗi cảnh đa cảnh, chuyển đổi góc quay và giữ cho các nhân vật nhất quán xuyên suốt các cảnh. Nó cũng cho phép bạn kiểm soát cách video bắt đầu và kết thúc. Tóm lại, bạn sẽ có nhiều tự do hơn và kết quả chuyên nghiệp hơn.

Tóm lại: Bạn đang dạy AI những gì cần tạo ra. Veo 3 là một học sinh giỏi. Veo 3.1 là một học sinh xuất sắc. Bạn dạy cả hai theo cùng một cách, nhưng Veo 3.1 học tốt hơn và ghi nhớ nhiều chi tiết hơn.

Lời nhắc chuyển văn bản thành video Veo 3.1

Bạn cần dựa vào cấu trúc 5 yếu tố đơn giản khi viết các gợi ý cho Veo 3.1. Thứ tự này quan trọng vì nó tuân theo cách các nhà làm phim lên kế hoạch cho các cảnh quay, từ máy quay đến cảm xúc.

5 yếu tố đó là:

  • Quay phim – cách máy quay đóng khung và di chuyển
  • Chủ thể – người hoặc vật mà người xem nhìn thấy
  • Hành động – những gì xảy ra trên màn hình
  • Bối cảnh – nơi và thời điểm xảy ra
  • Phong cách và Không gian – vẻ ngoài, màu sắc và âm thanh

Bắt đầu với máy quay, sau đó lấp đầy những gì xuất hiện trong khung hình. Chuỗi này giúp Veo 3.1 hiểu không chỉ những gì cần hiển thị, mà còn làm thế nào để tạo cảm giác chân thực và điện ảnh.

1. Quay phim – Máy quay

Máy quay là nơi mọi video hay bắt đầu. Nó quyết định cách khán giả nhìn nhận và cảm nhận câu chuyện.

Trước tiên, hãy chọn loại cảnh quay của bạn: góc rộng cho không gian, góc trung bình cho cuộc trò chuyện, hoặc góc cận cho cảm xúc. Sau đó, hãy mô tả cách máy quay di chuyển. Một cú dolly-in chậm rãi tạo nên sự gần gũi, trong khi một cú tracking mượt mà tạo nên chuyển động và năng lượng. Nếu bạn thích bố cục tĩnh lặng, hãy chọn cảnh quay tĩnh.

Cuối cùng, hãy đề cập đến tiêu điểm. Độ sâu trường ảnh nông sẽ làm nổi bật chủ thể. Tiêu điểm sâu sẽ giữ mọi thứ sắc nét cho phong cách phim tài liệu.

Lời nhắc:

  • Cảnh quay rộng, chân máy cố định, độ sâu trường ảnh tinh tế
  • Chuyển cảnh chậm từ góc rộng sang góc trung bình trong hơn 4 giây, độ sâu trường ảnh nông giúp chủ thể luôn sắc nét, tạo sự gần gũi
  • Đẩy vào chậm rãi, ánh sáng nền nhẹ nhàng tạo hình bóng, cận cảnh thân mật của một thanh niên bên cửa sổ loang lổ mưa

2. Chủ ngữ – Ai hoặc Cái gì

Chủ thể của bạn là trung tâm của khung hình. Hãy cho Veo 3.1 biết chính xác những gì máy ảnh nhìn thấy.

Mô tả mọi người với một vài đặc điểm rõ ràng: độ tuổi, kiểu tóc, trang phục và tâm trạng. Đối với đồ vật hoặc sản phẩm, hãy tập trung vào kết cấu, chất liệu và màu sắc. Những chi tiết nhỏ này giúp AI duy trì tính nhất quán của hình ảnh trong các clip khác nhau.

Lời nhắc:

  • Yếu: Đàn ông
  • Tốt hơn: Một người sáng lập thân thiện trong một studio sáng sủa với ánh sáng dịu nhẹ, mặc trang phục chuyên nghiệp
  • Chuyên môn: Một người đàn ông ngoài 20 tuổi với mái tóc màu hạt dẻ dài ngang vai, dáng vẻ tự tin, đôi mắt đen thông minh, mặc một chiếc áo khoác denim cổ điển với vẻ phấn khích trong mắt

3. Hành động – Điều gì đang xảy ra

Hãy sử dụng các động từ mô tả cách thức và lý do tại sao một sự việc xảy ra. “Cô ấy đi bộ” thì được, nhưng “Cô ấy đi bộ với những bước chân bình tĩnh, thận trọng” sẽ cho Veo 3.1 biết nên thể hiện tâm trạng nào. Nếu bạn đưa vào lời thoại, hãy giữ cho lời thoại ngắn gọn và tự nhiên — vừa đủ để gợi ý giọng điệu.

Hãy nhớ rằng, hành động rõ ràng sẽ biến một khung hình tĩnh thành một khoảnh khắc sống động.

Lời nhắc:

  • Chung chung: Một người đang khám phá
  • Tốt hơn: Khám phá khu chợ đường phố, nếm thử các món ăn khác nhau trong khi trò chuyện, thỉnh thoảng nhìn vào máy ảnh
  • Chuyên nghiệp: Cô ấy vừa nói chuyện vừa nếm thử các món ăn đường phố khác nhau, thỉnh thoảng nhìn vào máy ảnh trước khi quay sang chỉ vào những quầy hàng thú vị, hào hứng nói về mỗi khám phá.

4. Bối cảnh – Ở đâu và Khi nào

Cùng một tư thế có thể mang lại cảm giác hoàn toàn khác biệt trong một căn hộ penthouse sang trọng, một quán cà phê ấm cúng, hay một khu chợ đường phố nhộn nhịp. Hãy mô tả bối cảnh với các chi tiết cụ thể: đó là địa điểm nào, những gì có thể nhìn thấy trong khung cảnh, thời điểm trong ngày, hướng ánh sáng, và thậm chí cả mùa hoặc thời tiết.

Một mô tả ngữ cảnh mạnh mẽ sẽ neo cảnh của bạn vào một thế giới sống động, đáng tin mà người xem có thể hình dung và kết nối ngay lập tức.

Lời nhắc:

  • Mơ hồ: Bên ngoài, ban ngày
  • Tốt hơn: Một khu chợ đường phố Tokyo nhộn nhịp với các gian hàng và không khí sôi động, ánh nắng buổi chiều tạo nên những bóng râm tuyệt đẹp giữa các gian hàng
  • Chuyên nghiệp: Văn phòng khởi nghiệp công nghệ hiện đại với tường gạch trần, bàn làm việc đứng, nhiều màn hình, cây xanh và cửa sổ lớn nhìn ra đường phố nhộn nhịp vào giờ vàng, ánh nắng ấm áp tạo nên những bóng đổ dài trên sàn nhà

5. Phong cách & Không gian – Tâm trạng và Âm thanh

Phong cách và không khí quyết định diện mạo và âm thanh của video. Chúng tạo nên tông điệu cảm xúc gắn kết mọi thứ lại với nhau.

Trước tiên, hãy chọn phong cách hình ảnh của bạn. Bạn muốn một thứ gì đó mang tính điện ảnh, phim tài liệu hay thương mại? Sau đó, hãy mô tả bảng màu. Tông màu ấm tạo cảm giác hấp dẫn; tông màu lạnh tạo cảm giác yên bình và sạch sẽ. Cuối cùng, hãy thêm hướng âm thanh. Hãy làm rõ về nhạc nền, tiếng ồn xung quanh hoặc lời thoại. Thay vì nói “nhạc nền”, hãy mô tả nó bằng cảm giác — tiếng piano êm dịu, nhịp điệu sôi động, hoặc tiếng mưa rơi xung quanh.

Lời nhắc:

  • Điểm yếu: Phong cách chuyên nghiệp, ánh sáng đẹp, âm thanh tốt
  • Tốt hơn: Phong cách phim tài liệu điện ảnh với tông màu ấm áp. Âm thanh: không gian văn phòng yên tĩnh và tiếng gõ bàn phím nhẹ nhàng, cô ấy nói: Nguyên mẫu đã sẵn sàng.
  • Chuyên nghiệp: Phong cách thương mại sang trọng đậm chất điện ảnh với tông màu sâm panh ấm áp và xám lạnh, chất lượng 4K chuyên nghiệp. Âm thanh: Tiếng bước chân nhẹ nhàng, âm thanh văn phòng xa xăm (tiếng máy tính, tiếng chuông điện thoại yếu ớt), tiếng piano nhẹ nhàng được hòa trộn rất mờ nhạt bên dưới, độ sâu trường ảnh nông.

Mẫu nhắc nhở

  • QUAY PHIM: [kiểu cảnh quay], [chuyển động máy quay], [thuộc tính ống kính]
  • CHỦ ĐỀ: [mô tả chi tiết về người/cái gì trong khung hình]
  • HÀNH ĐỘNG: [điều gì đang xảy ra, cách họ di chuyển, ý định của họ]
  • BỐI CẢNH: [nơi nào, khi nào, thời tiết, hướng ánh sáng, thời gian trong ngày]
  • PHONG CÁCH & KHÔNG GIAN: [phong cách hình ảnh, tâm trạng, bảng màu], Âm thanh: [đối thoại/SFX/không gian xung quanh/nhạc]

Ví dụ đầy đủ

  • QUAY PHIM: Chuyển động chậm qua phòng khách tối giản, cảnh quay toàn cảnh chuyển sang cảnh quay trung bình, độ sâu trường ảnh nông, phông nền trắng trong
  • CHỦ ĐỀ: Một phụ nữ chuyên nghiệp ở độ tuổi giữa 30, vẻ ngoài chỉn chu, áo khoác vest may đo, tư thế tự tin, đôi mắt thông minh
  • HÀNH ĐỘNG: Cô ấy bước vào phòng một cách có mục đích, dừng lại ở một cửa sổ lớn, nhìn ra thành phố bên dưới một cách trầm ngâm, rồi quay lại nhìn máy quay.
  • NGỮ CẢNH: Phòng khách hiện đại tối giản với cửa sổ kính suốt từ sàn đến trần, ánh nắng buổi sáng chiếu những bóng dài mềm mại xuống sàn gỗ sồi, tường trắng sạch sẽ, đồ nội thất hiện đại, có thể nhìn thấy cảnh quan thành phố qua cửa sổ vào giờ vàng
  • PHONG CÁCH & KHÔNG GIAN: Phong cách phim tài liệu sang trọng, ấm áp và lôi cuốn, 4K chuyên nghiệp. Âm thanh: Tiếng bước chân nhẹ nhàng, âm hưởng thành phố xa xôi rất mờ nhạt, tiếng piano nhẹ nhàng bên dưới, không lời thoại, không phụ đề

Lời nhắc chuyển đổi hình ảnh sang video Veo 3.1

Tại sao lời nhắc chuyển đổi hình ảnh sang video lại khác biệt

Chuyển đổi hình ảnh sang video hoạt động theo cách khác. Bạn không còn mô tả toàn bộ khung cảnh nữa. Hình ảnh đã hiển thị chủ thể, ánh sáng và môi trường.

Công việc của bạn chỉ đơn giản là làm cho nó hoạt hình.

Điều này có nghĩa là lời nhắc của bạn sẽ ngắn hơn. Thường chỉ từ 50–100 từ , thay vì 100–180 từ đối với video chuyển văn bản.

Khung CCAD

Bạn có thể sử dụng CCAD Framework để đưa ra lời nhắc chuyển đổi hình ảnh thành video:

  • [C]amera – Máy quay nên di chuyển như thế nào?
  • [C]ác nhân vật – Ai hoặc cái gì có trong hình ảnh (tóm tắt—hình ảnh cho thấy họ)
  • [A]ction – Những hành động nào nên diễn ra?
  • [D]ialogue – Họ nên nói gì?

Bạn không nhất thiết phải bao gồm cả bốn yếu tố này mỗi lần. Nhiều đoạn phim hay hoàn toàn bỏ qua lời thoại, và một số bỏ qua cả lời thoại của nhân vật. Điều quan trọng là phải cụ thể hóa những gì cần chuyển động hoặc cần được lắng nghe.

Ví dụ đầy đủ

1.Chuyển đổi chân dung chuyên nghiệp thành hoạt hình

Hình ảnh tham khảo: Người phụ nữ chuyên nghiệp tại bàn làm việc với máy tính xách tay

Lời nhắc:

  • Máy ảnh: Chuyển động chậm trong ba giây từ góc rộng sang góc trung bình
  • Nhân vật: Người phụ nữ chuyên nghiệp tại bàn làm việc của mình
  • Hành động: Cô ấy gõ trên máy tính xách tay, dừng lại, nhìn lên máy ảnh với nụ cười hiểu ý, rồi lại nhìn xuống
  • Đối thoại: Nói “Tôi đã xử lý xong việc này”
  • Âm thanh: Tiếng gõ bàn phím nhẹ nhàng, không khí văn phòng nhẹ nhàng

2. Hoạt ảnh sản phẩm (Đồng hồ cao cấp)

Hình ảnh tham khảo: Đồng hồ sang trọng trên bề mặt đá cẩm thạch

Lời nhắc:

  • Camera: Gimbal xoay chậm 360 độ quanh đồng hồ, khung hình ở giữa
  • Hoạt động: Đồng hồ quay chậm để hiển thị mọi góc độ, ánh sáng bắt được bề mặt được đánh bóng
  • Âm thanh: Tiếng tích tắc của đồng hồ cơ học chân thực, nhẹ nhàng và nhịp nhàng, không có lời thoại.

3. Chuyển ảnh du lịch thành chuyển động

Hình ảnh tham khảo: Ảnh du lịch về một con kênh lúc hoàng hôn

Lời nhắc:

  • Camera: Camera tiến về phía trước 30%, hiệu ứng thị sai tinh tế
  • Hành động: Giữ nguyên khung hình và bảng màu ban đầu, thêm gợn sóng chậm trên mặt nước, những đám mây trôi
  • Âm thanh: Âm thanh nhẹ nhàng của thành phố, tiếng nước gợn sóng

Dấu thời gian nhắc nhở: Tạo video nhiều cảnh

Veo 3.1 bổ sung một tính năng mới mạnh mẽ: nhắc nhở dấu thời gian .

Thay vì tạo một cảnh quay duy nhất, bạn có thể tạo một chuỗi cảnh quay đầy đủ trong một video dài tám giây. Bạn chia clip thành các khối thời gian nhỏ, chẳng hạn như:

  • [00:00–00:02]
  • [00:02–00:04]
  • [00:04–00:06]

Mỗi khối cho Veo 3.1 biết chuyển động của camera, hành động hoặc đoạn hội thoại nào diễn ra tại thời điểm chính xác đó.

Điều này cho phép bạn:

  • Thay đổi góc
  • Giới thiệu các hành động mới
  • Chuyển đổi vị trí
  • Giữ cho các ký tự nhất quán

Tất cả trong một lời nhắc.

Cảnh quay nhiều cảnh

[00:00-00:02] Cảnh quay trung bình từ phía sau một nữ nhà thám hiểm trẻ với chiếc cặp da và mái tóc nâu rối bù buộc đuôi ngựa, khi cô ấy đẩy một dây leo lớn trong rừng ra để lộ ra một con đường ẩn

[00:02-00:04] Cảnh quay ngược khuôn mặt đầy tàn nhang của nhà thám hiểm, vẻ mặt cô tràn ngập sự kinh ngạc khi nhìn chằm chằm vào những tàn tích cổ xưa phủ đầy rêu ở phía sau. SFX: Tiếng lá cây xào xạc, tiếng chim hót líu lo từ xa.

[00:04-00:06] Cảnh quay theo chân nhà thám hiểm khi cô bước vào khoảng đất trống và lướt tay trên những hình chạm khắc tinh xảo trên bức tường đá đổ nát. Cảm xúc: Ngạc nhiên và tôn kính

[00:06-00:08] Cảnh quay góc rộng, cao, cho thấy nhà thám hiểm đơn độc đứng nhỏ bé giữa quần thể đền thờ rộng lớn, bị lãng quên, một nửa bị rừng rậm nuốt chửng. SFX: Một bản nhạc giao hưởng êm dịu, du dương bắt đầu vang lên

Cảnh đối thoại chuyên nghiệp

[00:00-00:02] Cảnh quay trung bình, một người phụ nữ mặc trang phục công sở thường ngày đang ngồi tại bàn làm việc trong một văn phòng hiện đại, đang làm việc trên máy tính xách tay của mình

[00:02-00:04] Cận cảnh khuôn mặt cô ấy khi cô ấy ngẩng lên khỏi màn hình và mỉm cười, gật đầu chào khi có người bước vào. Hội thoại: Cô ấy nói, “Bạn đến đúng giờ. Tôi rất cảm kích.”

[00:04-00:06] Cảnh quay qua vai cho thấy một người khác đang ngồi đối diện cô ấy tại bàn

[00:06-00:08] Cảnh quay toàn cảnh văn phòng, từ từ lùi lại để cho thấy cả hai người đang trò chuyện bên cửa sổ nhìn ra thành phố

Cách đăng video của bạn lên hơn 1000 tài khoản

Giờ đây, video Veo 3.1 của bạn trông thật điện ảnh và chuyên nghiệp. Nhưng việc tạo ra chúng chỉ là một nửa công việc — bạn vẫn cần phải xuất bản chúng.

Việc tải lên thủ công 10, 50 hoặc 100 tài khoản mất hàng giờ. Và việc đăng bài từ cùng một thiết bị rất rủi ro. Các nền tảng phát hiện IP và dấu vân tay thiết bị được chia sẻ, điều này có thể kích hoạt lệnh cấm ẩn hoặc đình chỉ vĩnh viễn.

GeeLark là gì?

GeeLark kết hợp hai công cụ mạnh mẽ trong một nền tảng — điện thoại đám mây và trình duyệt chống phát hiện. Thiết lập này cho phép bạn chạy nhiều tài khoản một cách an toàn và quản lý mọi thứ từ một bảng điều khiển duy nhất. Bạn không cần điện thoại vật lý hay nhiều thiết bị. Mỗi điện thoại đám mây hoặc hồ sơ trình duyệt đều chạy trên môi trường riêng biệt với hệ thống riêng.

Bạn có thể quản lý hàng chục hoặc hàng trăm tài khoản mà không lo bị phát hiện hoặc bị cấm tài khoản.

Tự động hóa việc tạo video bằng AI: Quy trình làm việc của GeeLark

Bạn có thể tạo video AI và xuất bản chúng lên tài khoản của mình chỉ trong một quy trình làm việc mượt mà. Mọi thứ diễn ra tại cùng một nơi, nên quy trình rất nhanh chóng và dễ dàng. Tôi sẽ chỉ cho bạn cách hoàn thành mọi thứ chỉ trong 4 bước đơn giản.

Bước 1: Tạo video của bạn

Mở phần AI của GeeLark (Thư viện → AI).

Chọn giữa “Chuyển văn bản thành video” hoặc “Chuyển hình ảnh thành video”, viết lời nhắc, chọn mô hình, đặt định dạng, chọn có tạo âm thanh hay không và nhấp vào “Gửi”.

Video của bạn sẽ tự động xuất hiện trong “Thư viện”.

Bước 2: Chọn Mẫu tự động hóa

Trong Tự động hóa → Thị trường , hãy chọn mẫu như ” Đăng video TikTok “. Mẫu này cho phép bạn tự động đẩy video từ Thư viện của mình đến nhiều tài khoản TikTok.

Bước 3: Cấu hình “Đăng video TikTok”

Chọn video muốn đăng, chọn tài khoản mục tiêu (10, 50 hoặc nhiều hơn), đặt lịch đăng và tùy chỉnh tiêu đề, chú thích hoặc thẻ AI. Nhấp vào ” Xác nhận đăng ” và GeeLark sẽ thực hiện phần còn lại.

Bước 4: Tự động hóa các tác vụ trên đám mây

Sau khi bạn đặt lịch, GeeLark sẽ tự động đăng video lên tài khoản TikTok của bạn vào thời điểm bạn chọn. Ứng dụng chạy trên nền tảng đám mây, do đó vẫn hoạt động ngay cả khi bạn tắt GeeLark hoặc tắt máy tính. GeeLark hoạt động 24/7, đảm bảo video của bạn luôn được đăng tải đúng thời hạn.