Fókuszban: MI csevegés , Retrohoz hasonló játékok , helyszínváltoztató , Roblox feloldva
Az AI művészeti generátorok idén nagy figyelmet kaptak, akár látványos eredményeik, akár megkérdőjelezhető alkalmazásaik miatt. Az egyik legnagyobb szereplő ebben a szektorban az OpenAI Dall-E. Már elérhető a nagyközönség és a fejlesztők számára, és hamarosan beépül a Microsoft szoftverébe és a Bing keresőbe.
A Shutterstock szintén integrálni fogja az eszközt, és másolatok után fizet a művészeknek, hogy ezzel valamelyest visszaadjon, és remélhetőleg elkerülje az etikai nehézségeket. Végül is a Shutterstock képeit használták a Dall-E MI betanításához. De pontosan hogyan működik az együttműködés a Dall-E‑vel? Olyan egyszerű, hogy beírunk egy leírást, úgynevezett promptot, és kapunk egy képet? Őszintén szólva, szerintünk igen. De sokkal több mindent kell figyelembe venni, ha a tökéletességhez szeretnénk közel kerülni. Nézzük végig ezt az átfogó útmutatót arról, hogy hogyan kell használni a DALL‑E‑t.
Tartalomjegyzék
A DALL-E egy képgenerátor, amely mély tanulási technikákat és mesterséges intelligenciát (AI) használ a szöveges leírások megfelelő vizuális képekké alakításához. Az OpenAI által kifejlesztett DALL-E bemutatja a generatív modellek erejét az absztrakt fogalmak és ötletek kézzelfogható vizuális megjelenítésekké alakításában. A DALL-E képgenerálási folyamata neurális hálózatok és algoritmusok komplex hálózatát foglalja magában, amelyek megtanulnak bizonyos szavakat és kifejezéseket a megfelelő vizuális jellemzőkkel társítani. A képzés során a DALL-E képessé vált különféle képek generálására, beleértve a mindennapi tárgyakat, állatokat, jeleneteket és még olyan elvont fogalmakat is, amelyek esetleg nem szerepeltek közvetlenül a képzési adatokban.
Képgenerátorként a DALL-E hatékony eszközt kínál a felhasználóknak kreativitásuk felfedezéséhez és kifejezéséhez. A szöveges leírások élénk vizuális kimenetekké történő fordításával új lehetőségeket nyit meg a művészek, a tervezők és az alkotók számára ötleteik vizualizálására, különböző koncepciókkal való kísérletezésre és vizuálisan lenyűgöző kompozíciók létrehozására.
Ebben a részben lépésről lépésre útmutatást adunk a csodálatos DALL-E AI Art Generator használatához. Mégis, mielőtt mélyre ásna, fontos, hogy a Download DALL-E alkalmazást használja számítógépén. Egy másik lehetőség a DALL-E Online elérése a böngészőjében. Ezután a következő lépésekkel folytathatjuk.
Hozzon létre egy DALL-E fiókot
Az első lépés a regisztráció a labs.openai.com oldalon. Ez akkor lesz lehetséges, ha új ablakban nyitjuk meg. Hozz létre egy DALL-E bejelentkezést egy e-mail-címmel és egy erős jelszóval, vagy használj Google- vagy Microsoft-fiókot. Többfaktoros hitelesítésre nincs lehetőség.
Kérdező képek
Regisztráció után egy űrlap jelenik meg a promptod számára. Ha a Surprise Me gombra kattintasz, további véletlenszerű promptok kerülnek a szövegmezőbe; ezek addig nem számítanak bele a kreditekbe, amíg nem kattintasz a Generate gombra. Feltöltheted a saját képedet is, és a Dall-E segítségével szerkesztheted, új MI-generálta információkat hozzáadva, vagy teljesen új változatokat készítve az eredetiről – wall-e-surprise-me módjára.
Képváltozat
A Dall-E-ben létrehozott vagy a Dall-E-be feltöltött bármely kép szerzői joga biztosan Öné. Aztán onnantól azonnali változatot kaphat. A feltöltött fotókat négyzet alakú, 1:1 arányú képre kell vágni.
Szerkesztés: DALL-E kép törlése
Tegyük fel, hogy készítettél egy Dall-E képet, amely tetszik. Többnyire. De valami nem teljesen jó. Válaszd az Edit opciót, és használd az Eraser eszközt, hogy eltávolítsd a részt, ami nem tetszik, majd írd át a prompt vonatkozó részét, hogy arra a részre reagálj.
Szerkesztés: DALL-E kép nagyítása
Egy másik lehetőség az Edit alatt a Generation Frames létrehozása. Kattints az Add Generation Frame ikonra bal felül, amely egy plusz jellel ellátott dobozra hasonlít, és kapsz egy lebegő keretet, amelyet tetszőlegesen elhelyezhetsz a kép határain kívül.
Hogyan írhat hatékony felszólítást a DALLE számára, ha megkapja, amit belerakott? Röviden, tegyük fel, hogy fényképe már létezik valamilyen internetes galériában, majd írja be a mellette megjelenő rövid szövegtípust.
Légy konkrét
Ha csak egyetlen szót írsz be, például hogy runner (futó), akkor bármit kaphatsz: egy elit sportoló maratonbefutójának fotójától kezdve egy bájos ceruzarajzig egy réten futkározó kisgyerekről, vagy – ahogy a fenti példában is látszik – akár egy kitalált lényt is! Egyetlen szó helyett inkább egy kifejezést használj, hogy pontosabban kifejezd, mit szeretnél.
Utasítás részletei
Az, hogy egyszerűen csak megemlíted az olajfestményt, helyett mondhatod azt is, hogy olaj-vászonra, Caravaggio remekműve 1599-ből, vagy nagy felbontású fotó, Canon fényképezőgép, stúdióvilágítás, nagy formátumú portré Kodak ColorPlus 200 filmre. Ezeknek a különböző jellemzőknek a beépítése az image-promptokba arra készteti az MI-technológiát, hogy meghatározza, milyen típusú képet szándékozol létrehozni, még ha nem is mindig találja el teljesen pontosan.
Kerüld el a bakikat
Mivel a mesterséges intelligencia létrehozásának korlátai vannak, egyes képfelhívások kisebb valószínűséggel érik el a kívánt hatást.
A DALL-E és utódja, a DALL-E 2 az OpenAI által kifejlesztett úttörő generatív modellek, amelyek forradalmasították a mesterséges intelligencia és a kreativitás területét. Ezek a modellek mély tanulási technikákat alkalmaznak, hogy szöveges leírásokból képeket hozzanak létre, lehetővé téve a mesterséges intelligencia számára, hogy nagyszerű művészi képességeket mutasson fel. Ez az átfogó áttekintés a DALL-E 2 által az elődjéhez képest kínált fejlesztéseket és fejlesztéseket vizsgálja.
A DALL-E 2 egyik figyelemre méltó fejlesztése a jobb képminőség és felbontás. Míg a DALL-E már képes lenyűgöző látványt generálni, a DALL-E 2 tovább viszi, részletesebb és valósághűbb képeket készítve. A nagyobb felbontás finomabb textúrákat, élesebb éleket és általános vizuális hűséget tesz lehetővé. A DALL-E 2 kimeneti képei észrevehető látványt és tisztaságot mutatnak.
A DALL-E 2 számos kulcsfontosságú funkciót mutat be, amelyek nagyobb irányítást és rugalmasságot biztosítanak a felhasználóknak a generált képek felett. A modell lehetővé teszi a felhasználók számára, hogy interaktív promptokon keresztül befolyásolják a képgenerálási folyamatot, ahol speciális szerkesztések végezhetők, hogy a kimenetet a kívánt irányba tereljék. Ez a vezérlési szint lehetővé teszi a felhasználók számára, hogy finomhangolják és iterálják kreatív elképzeléseiket, ami személyre szabottabb és személyre szabottabb eredményeket eredményez.
A DALL-E 2 jelentősen javítja az összetett szöveges leírások megértését, szélesebb szókincset és a fogalmak mélyebb megértését kínálja. Ez a kibővített tudásbázis lehetővé teszi, hogy a modell jobban értelmezze az árnyalt utasításokat, ami pontosabb és kontextusnak megfelelő képgenerálást eredményez. A felhasználók most már összetett jeleneteket, elvont fogalmakat és bonyolult vizuális részleteket írhatnak le, a DALL-E 2 pedig hatékonyabban hoz létre a tervezett jelentésükhöz igazodó képeket.
| VÖLGY | DAL-E 2 | |
| Ár | $2 | $15. |
| Kiadási dátum | 2021. január 05 | 2022. szeptember 22 |
| Határozatok | 2024 x 1024 pixel, 512 x 512 pixel és 256 x 256 | 2024 x 1024 pixel, 512 x 512 pixel és 256 x 256 |
| Alapértelmezett | Hibavédelem | Normál kevésbé hibás. |
| Minőség | ||
| Hitelesség | ||
| Kreativitás |
Minőség:9.0
Rugalmasság:9,0
Szókincs:8,5
Minőség:9,5
Rugalmasság:9,0
Szókincs:8,5
A Dall-E nem teljesen ingyenes. A szolgáltatás Kreditek (új ablakban nyílik meg) alapján működik. Regisztrációkor 50 ingyen kreditet kapsz, majd ezt követően havonta 15 ingyen kreditet, de ezek nem vihetők át a következő hónapra. A fizetett kreditek havonta legfeljebb 12 hónapig átgördülnek; $2 és $15 között 115 kreditet kapsz. Egy kredit egy MI-művészeti generálást tesz lehetővé (normál generálásnál négy új kép). Ez indulhat egy prompttal, de lehet kredit már létrehozott munka egy változatának készítésére is. Rengeteg kreditet el lehet pazarolni, miközben megpróbálod megtalálni a megfelelő MI-generálta képet.
Hogyan vihetünk be szöveges leírást, hogy képeket generáljunk a DALL‑E‑vel?
A DALL-E képgenerátorának használatához szöveges promptot vagy leírást kell megadnia. Egyszerűen írja be a kívánt leírást, vagy adja meg a koncepciót, attribútumokat vagy jelenetet, amelyet a generált képen ábrázolni szeretne. A DALL-E ezután értelmezi a bemenetet, és a leírás alapján képet generál.
Szabályozhatjuk-e a DALL‑E kimenetét úgy, hogy az megfeleljen a preferenciáinknak?
Igen, a DALL-E bizonyos szintű vezérlést biztosít a generált képek felett. Kísérletezhet különböző promptokkal, módosíthat a prompton belüli konkrét részleteket vagy attribútumokat, vagy további utasításokat adhat a kép létrehozási folyamatának irányításához. Ez lehetővé teszi a kimenet finomhangolását és a kreatív elképzeléseihez való szorosabb illeszkedést
A DALL‑E 2 használata ingyenes?
A DALL-E 2 végül befejezte a várólistát, és 2022 szeptemberében megnyitotta a platformot a nagyközönség előtt. A felhasználók 50 ingyenes kredittel kezdik, hogy a kereséseket teljesen kidolgozott műalkotásokká alakítsák, majd havonta 15 ingyenes kreditet. A weboldalon további krediteket is vásárolhat.
Milyen korlátai vagy megkötései vannak a DALL‑E használatának?
Bár a DALL-E lenyűgöző eszköz, van néhány korlátja. Előfordulhat, hogy a DALL-E nem mindig pontosan azt a képet adja, amelyre gondol, mivel a modell értelmezése szubjektív lehet. Ezután a DALL-E kimenetét befolyásolják azok a tanítási adatok, amelyeknek ki volt téve, ami azt jelenti, hogy nem hoz létre teljesen új vagy eredeti koncepciókat. A rendkívül specifikus vagy ritka tulajdonságokkal rendelkező képek létrehozása is kihívást jelenthet, mivel a modell betanítási adatai nem feltétlenül fedik le az összes lehetséges variációt.
Vannak-e etikai megfontolások a DALL‑E képgenerátor használatakor?
Mint minden mesterséges intelligencia eszköznél, a DALL-E képgenerátorának használatakor is vannak etikai megfontolások. Fontos annak biztosítása, hogy a létrehozott képek összhangban legyenek a társadalmi normákkal és etikai irányelvekkel. Az OpenAI tartalomszűrési mechanizmusokat vezetett be a kockázatok csökkentése és a visszaélések megelőzése érdekében. A felhasználóknak felelősségteljesen kell használniuk a DALL-E-t, hogy elkerüljék a káros vagy nem megfelelő tartalom létrehozását, és be kell tartaniuk az OpenAI szolgáltatási feltételeit és használati irányelveit.
Következtetés
A DALL-E segítségével a felhasználók szöveges felszólításokat és leírásokat adhatnak, hogy kiváló minőségű képeket hozzanak létre, amelyek illeszkednek kreatív elképzeléseikhez. A különböző promptokkal való kísérletezés, az interaktív vezérlők kihasználása és az utasítások finomítása révén a felhasználók jobban irányíthatják a kimenetet, és saját preferenciáik szerint szabhatják azt. Nyilvánvalóan ezzel az útmutatóval többet tudtunk meg róla. Ezért most ossza meg barátaival, akiknek szüksége van rá.
Hasznosnak találta ezt?
366 szavazat
Minden az egyben videó konverter, szerkesztő, javító AI-val feljavítva.