Điểm nổi bật: Trò chuyện bằng AI , các trò chơi như Retro , thay đổi vị trí , Roblox đã được mở khóa
Các nhà sản xuất nghệ thuật AI đã nhận được nhiều sự chú ý trong năm nay, cho dù vì những thành tựu ngoạn mục hay những ứng dụng đáng nghi vấn. Một trong những người chơi lớn nhất trong lĩnh vực này là Dall-E của OpenAI. Nó hiện đã có sẵn cho công chúng và các nhà phát triển và sẽ sớm được tích hợp vào phần mềm của Microsoft và công cụ tìm kiếm Bing.
Shutterstock cũng sẽ tích hợp công cụ này và trả tiền bản quyền cho các nghệ sĩ để đền đáp và hy vọng tránh được các khó khăn về đạo đức. Sau cùng thì, hình ảnh của Shutterstock đã được sử dụng để huấn luyện AI Dall-E. Nhưng chính xác thì bạn hợp tác với Dall-E như thế nào? Có phải đơn giản chỉ là nhập một mô tả gọi là “prompt” và nhận về một bức tranh? Thành thật mà nói, chúng tôi nghĩ là vậy. Nhưng còn rất nhiều yếu tố khác cần cân nhắc nếu bạn muốn tiến gần đến mức độ hoàn hảo. Hãy cùng thảo luận qua hướng dẫn chi tiết này về cách sử dụng DALL-E.
Mục lục
DALL-E là trình tạo hình ảnh sử dụng kỹ thuật học sâu và trí tuệ nhân tạo (AI) để chuyển đổi mô tả văn bản thành hình ảnh trực quan tương ứng. Được phát triển bởi OpenAI, DALL-E thể hiện sức mạnh của các mô hình tổng quát trong việc chuyển đổi các khái niệm và ý tưởng trừu tượng thành các hình thức thể hiện trực quan hữu hình. Quá trình tạo hình ảnh của DALL-E bao gồm một mạng lưới phức tạp gồm các mạng thần kinh và thuật toán học cách liên kết các từ và cụm từ cụ thể với các đặc điểm hình ảnh tương ứng. Thông qua đào tạo, DALL-E đã có được khả năng tạo ra nhiều hình ảnh khác nhau, bao gồm các vật thể hàng ngày, động vật, cảnh vật và thậm chí cả các khái niệm trừu tượng có thể không có trực tiếp trong dữ liệu đào tạo.
Là một trình tạo hình ảnh, DALL-E cung cấp cho người dùng một công cụ mạnh mẽ để khám phá và thể hiện khả năng sáng tạo của mình. Bằng cách chuyển các mô tả văn bản thành kết quả trực quan sống động, nó mở ra những khả năng mới cho các nghệ sĩ, nhà thiết kế và người sáng tạo trong việc hình dung ý tưởng của họ, thử nghiệm các khái niệm khác nhau và tạo ra các tác phẩm có hình ảnh ấn tượng.
Trong phần này, chúng tôi sẽ cung cấp cho bạn hướng dẫn từng bước về cách sử dụng Trình tạo nghệ thuật AI DALL-E tuyệt vời. Tuy nhiên, trước khi tìm hiểu sâu, điều quan trọng là phải sử dụng Tải xuống DALL-E trên máy tính của bạn. Một tùy chọn khác là truy cập DALL-E Online trên trình duyệt web của bạn. Sau đó, bây giờ chúng ta có thể tiến hành các bước sau.
Tạo tài khoản DALL-E
Bước đầu tiên là đăng ký tại labs.openai.com. Việc đó sẽ thực hiện được nếu chúng ta mở trong một cửa sổ mới. Tạo Đăng nhập DALL-E bằng Địa chỉ Email và Mật khẩu Mạnh, hoặc dùng Tài khoản Google hay Microsoft. Không có tùy chọn xác thực đa yếu tố.
Hình ảnh nhắc nhở
Sau khi đăng ký, bạn sẽ thấy một biểu mẫu dành cho Prompt của mình. Khi bạn nhấp nút Surprise Me, các prompt ngẫu nhiên bổ sung sẽ được đưa vào hộp văn bản; chúng sẽ không bị trừ vào số credit của bạn cho đến khi bạn nhấn Generate. Bạn cũng có thể tải lên hình ảnh của mình và dùng Dall-E để chỉnh sửa nhằm thêm nội dung mới do AI tạo ra hoặc tạo ra những biến thể hoàn toàn mới bất ngờ của bản gốc.
Biến thể hình ảnh
Đối với bất kỳ hình ảnh nào bạn tạo trong Dall-E hoặc bất kỳ hình ảnh nào bạn tải lên Dall-E đều chắc chắn rằng bạn sở hữu bản quyền. Sau đó, từ đó, bạn có thể có một biến thể ngay lập tức. Ảnh đã tải lên phải được cắt thành ảnh vuông có tỷ lệ 1:1.
Chỉnh sửa: Xóa hình ảnh DALL-E
Giả sử bạn đã tạo được một hình ảnh với Dall-E mà bạn khá thích. Phần lớn là ổn. Nhưng có gì đó chưa đúng lắm. Hãy chọn Edit và dùng công cụ Eraser để xóa phần bạn không thích, sau đó viết lại một phần của prompt để xử lý riêng phần đó.
Chỉnh sửa: Phóng to hình ảnh DALL-E
Một lựa chọn khác trong mục Edit là tạo Generation Frames. Nhấp vào biểu tượng Add Generation Frame ở góc trên bên trái, trông giống như một khung hộp có dấu cộng, và bạn sẽ có một khung nổi có thể đặt ở bất cứ đâu bên ngoài ranh giới của hình ảnh.
Làm thế nào để bạn viết một lời nhắc hiệu quả cho DALLE khi bạn nhận được những gì bạn đưa vào đó? Nói tóm lại, giả sử bức ảnh của bạn đã tồn tại trong một loại thư viện internet nào đó, sau đó viết loại văn bản ngắn mà bạn có thể thấy hiển thị cùng với nó.
Hãy làm cho nó cụ thể
Nếu bạn chỉ nhập một từ, chẳng hạn runner (vận động viên chạy), bạn có thể nhận được bất cứ thứ gì từ bức ảnh một vận động viên đẳng cấp đang về đích marathon cho đến một bức phác họa bút chì dễ thương về một em bé chạy qua cánh đồng, hoặc như ví dụ phía trên, thậm chí là một sinh vật tưởng tượng! Thay vì chỉ một từ, hãy dùng một cụm từ để thể hiện điều bạn mong muốn.
Chi tiết chỉ dẫn
Thay vì chỉ nhắc đến oil painting (tranh sơn dầu), bạn có thể nói oil-on-canvas, kiệt tác của Caravaggio năm 1599, hoặc ảnh HD, máy ảnh Canon, ánh sáng studio, chân dung khổ lớn trên phim Kodak ColorPlus 200. Việc đưa những đặc điểm khác nhau này vào trong prompt hình ảnh sẽ gợi ý cho công nghệ AI xác định loại hình ảnh bạn muốn, dù không phải lúc nào nó cũng làm chính xác hoàn toàn.
Tránh Sai Sót
Bởi vì việc tạo AI có những hạn chế cố hữu nên một số lời nhắc bằng hình ảnh ít có khả năng đạt được tác động như mong muốn.
DALL-E và người kế nhiệm của nó, DALL-E 2, là những mô hình sáng tạo đột phá được phát triển bởi OpenAI, đã cách mạng hóa lĩnh vực trí tuệ nhân tạo và sáng tạo. Những mô hình này sử dụng các kỹ thuật học sâu để tạo ra hình ảnh từ các mô tả bằng văn bản, cho phép AI thể hiện khả năng nghệ thuật tuyệt vời. Đánh giá toàn diện này sẽ đi sâu vào những tiến bộ và cải tiến được cung cấp bởi DALL-E 2 so với phiên bản trước.
Một trong những cải tiến đáng chú ý trong DALL-E 2 là chất lượng và độ phân giải hình ảnh được cải thiện. Trong khi DALL-E đã có thể tạo ra hình ảnh ấn tượng thì DALL-E 2 còn tiến xa hơn nữa, tạo ra hình ảnh chi tiết và chân thực hơn. Độ phân giải cao hơn cho phép kết cấu mịn hơn, các cạnh sắc nét hơn và độ trung thực hình ảnh tổng thể. Các hình ảnh đầu ra từ DALL-E 2 cho thấy sự cải thiện rõ ràng và hấp dẫn về mặt hình ảnh.
DALL-E 2 giới thiệu một số tính năng chính giúp người dùng kiểm soát tốt hơn và linh hoạt hơn đối với các hình ảnh được tạo ra. Mô hình này cho phép người dùng tác động đến quá trình tạo hình ảnh thông qua các lời nhắc tương tác, trong đó có thể thực hiện các chỉnh sửa cụ thể để hướng dẫn đầu ra theo các hướng mong muốn. Mức độ kiểm soát này cho phép người dùng tinh chỉnh và lặp lại tầm nhìn sáng tạo của họ, mang lại kết quả được cá nhân hóa và phù hợp hơn.
DALL-E 2 cải thiện đáng kể khả năng hiểu các mô tả văn bản phức tạp, cung cấp vốn từ vựng rộng hơn và nắm bắt sâu hơn các khái niệm. Cơ sở kiến thức mở rộng này cho phép mô hình diễn giải các hướng dẫn có sắc thái tốt hơn, dẫn đến việc tạo ra hình ảnh chính xác hơn và phù hợp với ngữ cảnh hơn. Giờ đây, người dùng có thể mô tả các cảnh phức tạp, khái niệm trừu tượng và chi tiết hình ảnh phức tạp và DALL-E 2 sẽ tạo ra hình ảnh phù hợp với ý nghĩa dự định của chúng một cách hiệu quả hơn.
| DAL-E | DAL-E 2 | |
| Giá | $2 | $15. |
| Ngày phát hành | Ngày 05 tháng 1 năm 2021 | Ngày 22 tháng 9 năm 2022 |
| Nghị quyết | 2024 x 1024 Pixel, 512 x 512 Pixel và 256 x 256 | 2024 x 1024 Pixel, 512 x 512 Pixel và 256 x 256 |
| Tiêu chuẩn | Bảo vệ lỗi | Tiêu chuẩn ít lỗi hơn. |
| Phẩm chất | ||
| Sự uy tín | ||
| Sáng tạo |
Chất lượng:9.0
Tính linh hoạt:9.0
Vốn từ vựng:8.5
Chất lượng:9.5
Tính linh hoạt:9.0
Vốn từ vựng:8.5
Dall-E không hoàn toàn miễn phí. Dịch vụ được tính dựa trên Credit (Mở trong cửa sổ mới). Bạn nhận 50 credit miễn phí khi đăng ký và 15 credit miễn phí mỗi tháng sau đó, nhưng chúng không được cộng dồn. Credit trả phí được cộng dồn hàng tháng tối đa 12 tháng; nhận 115 credit với giá từ $2 đến $15. Một credit cho phép bạn thực hiện một lần tạo tác phẩm nghệ thuật AI (bốn hình ảnh mới cho mỗi lần tạo thông thường). Việc đó có thể bắt đầu bằng một prompt, nhưng nó cũng có thể là một credit để tạo một phiên bản của tác phẩm đã được tạo trước đó. Bạn có thể lãng phí rất nhiều credit khi cố gắng tìm ra bức ảnh do AI tạo đúng ý.
Làm thế nào chúng ta có thể nhập mô tả bằng văn bản để tạo hình ảnh với DALL-E?
Bạn phải cung cấp lời nhắc hoặc mô tả bằng văn bản để sử dụng trình tạo hình ảnh của DALL-E. Chỉ cần nhập mô tả mong muốn của bạn hoặc chỉ định khái niệm, thuộc tính hoặc cảnh mà bạn muốn hình ảnh được tạo mô tả. DALL-E sau đó sẽ diễn giải thông tin đầu vào của bạn và tạo hình ảnh dựa trên mô tả đó.
Chúng ta có thể kiểm soát đầu ra của DALL-E để phù hợp với sở thích của mình không?
Có, DALL-E cung cấp mức độ kiểm soát nhất định đối với hình ảnh được tạo. Bạn có thể thử nghiệm các lời nhắc khác nhau, sửa đổi các chi tiết hoặc thuộc tính cụ thể trong lời nhắc hoặc cung cấp hướng dẫn bổ sung để hướng dẫn quá trình tạo hình ảnh. Điều này cho phép bạn tinh chỉnh đầu ra và điều chỉnh nó phù hợp hơn với tầm nhìn sáng tạo của bạn
DALL-E 2 có được sử dụng miễn phí không?
DALL-E 2 cuối cùng đã hoàn thành danh sách chờ và mở cửa nền tảng này cho công chúng vào tháng 9 năm 2022. Người dùng bắt đầu với 50 tín dụng miễn phí để chuyển đổi các tìm kiếm thành tác phẩm nghệ thuật được phát triển hoàn chỉnh, tiếp theo là 15 tín dụng miễn phí mỗi tháng. Bạn cũng có thể mua thêm tín dụng trên trang web.
Có những giới hạn hoặc ràng buộc nào khi sử dụng DALL-E không?
Mặc dù DALL-E là một công cụ ấn tượng nhưng nó cũng có một số hạn chế. DALL-E không phải lúc nào cũng tạo ra hình ảnh chính xác mà bạn nghĩ đến vì việc diễn giải mô hình có thể mang tính chủ quan. Tiếp theo, đầu ra của DALL-E bị ảnh hưởng bởi dữ liệu huấn luyện mà nó tiếp xúc, điều đó có nghĩa là nó có thể không tạo ra các khái niệm hoàn toàn mới hoặc nguyên bản. Ngoài ra, việc tạo hình ảnh có thuộc tính hiếm hoặc đặc biệt cao có thể gặp khó khăn vì dữ liệu huấn luyện của mô hình có thể không bao gồm tất cả các biến thể có thể có.
Có những cân nhắc đạo đức nào khi sử dụng trình tạo hình ảnh của DALL-E không?
Giống như bất kỳ công cụ AI nào, cần cân nhắc về mặt đạo đức khi sử dụng trình tạo hình ảnh của DALL-E. Việc đảm bảo rằng hình ảnh được tạo ra phù hợp với các chuẩn mực xã hội và nguyên tắc đạo đức là điều quan trọng. OpenAI đã triển khai các cơ chế lọc nội dung để giảm thiểu rủi ro và ngăn chặn việc sử dụng sai mục đích. Người dùng nên sử dụng DALL-E một cách có trách nhiệm để tránh tạo ra nội dung có hại hoặc không phù hợp, đồng thời tuân thủ các điều khoản dịch vụ và nguyên tắc sử dụng của OpenAI.
Phần kết luận
Với DALL-E, người dùng có thể cung cấp lời nhắc và mô tả bằng văn bản để tạo ra hình ảnh chất lượng cao phù hợp với tầm nhìn sáng tạo của họ. Bằng cách thử nghiệm các lời nhắc khác nhau, tận dụng các điều khiển tương tác và tinh chỉnh hướng dẫn, người dùng có thể kiểm soát tốt hơn kết quả đầu ra và điều chỉnh nó theo sở thích của họ. Rõ ràng là với hướng dẫn này, chúng tôi đã biết nhiều hơn về nó. Vì vậy, bây giờ chúng ta hãy chia sẻ nó với bạn bè của bạn, những người cần nó.
Tìm thấy điều này hữu ích không bạn?
366 Phiếu bầu
Bộ chuyển đổi video tất cả trong một, trình chỉnh sửa, trình tăng cường được nâng cấp bằng AI.