Zesvětli, zaostři, ořízni. Apple vyvinul technologii, která dokáže upravovat fotografie hlasem
Vývojáři v americké Santa Barbaře pracují na technologii MGIE, která umožní upravovat originální fotografie pomocí textových výzev, případně i hlasových pokynů. Zařídí to umělá inteligence, která bude povely realizovat. Apple již spustil testovací verzi.
V posledních letech umělá inteligence zaplavila prostor kreativního vytváření ilustračních obrázků a přetváření fotografií. Ne vždy jsou však výsledky uspokojivé.
Jednou z oblastí, kde byla umělá inteligence zatím opomíjená, je používání textových výzev, či řeči ke skutečné úpravě autorských fotografií, namísto pouhého vytváření alternativních vizuálů z celého digitálního spektra. To se nyní mění.
V únorové zprávě vydané výzkumníky univerzity v Santa Barbara a vývojáři Apple tvůrci platformy MGIE uvádějí, že úpravy obrázků pomocí AI a přirozeného jazyka by mohly být efektivnější a kvalitnější, než práce v klasických programech, jako je například Photoshop. O zprávě informoval specializovaný server shotkit.com
Práce s fotografií se zjednoduší
„Úpravy obrázků založené na pokynech zlepšují ovladatelnost a flexibilitu manipulace s obrázky pomocí přirozených příkazů bez složitých popisů. Lidské pokyny jsou zatím někdy příliš stručné na to, aby je současné metody mohly zachytit a dodržovat. Velké multimodální jazykové modely však již vykazují slibné schopnosti v porozumění a vytváření vizuálních reakcí prostřednictvím umělé inteligence,“ uvádí zpráva.
Podle nich nová technologie MGIE pomáhá vyřešit výše uvedený problém tím, že umožňuje právě editaci založenou na výrazových instrukcích. Dokáže z lidské řeči, nebo psaných slov pro umělou inteligenci vytvořit stručné a jasné pokyny, které efektivně vedou celý proces úprav.
Trochu jiný Photoshop
MGIE může provádět běžné úpravy ve stylu Photoshopu, jako je oříznutí, změna velikosti, otočení, převrácení přidání filtrů, či úprav jasu a ostrosti. Model může navíc použít i pokročilejší úpravy, jako je změna pozadí, přidání nebo odebrání objektů a prolnutí obrázků.
Autoři zprávy také vysvětlují, že MGIE dokáže optimalizovat celkovou kvalitu fotografií pomocí korekcí jasu, kontrastu, ostrosti a vyvážení barev a přidáním uměleckých efektů, jako jsou styly skic nebo malování. To vše může uživatel provést prostřednictvím instrukcí ve svém jazyce. Zvládne také upravovat konkrétní části fotografie, jako jsou oči nebo tváře, přičemž ostatní prvky zůstávají nedotčené. Technologie ale má ve své beta verzi zatím jednu vadu. Doba čekání na dokončení úprav může zatím být dlouhá několik minut i déle.
Tak rušno jako v posledních dnech kolem Applu už dlouho nebylo. Brzy Apple zveřejní výsledky za poslední kvartál minulého roku, oznámí, jak na něj dopadly problémy v Číně, chystá uvedení nového radikálního produktu a jen tak mimochodem zcela rázně změnil podmínky pro používání aplikací v zařízeních Apple. Vynuceně. A vynuceně také dojde ke snížení poplatků v App Storu. Akcie proto připomínají křivku EKG. A nejspíš budou ještě několik dní.Klíčové dny pro Apple a investory. Co přinesou výsledky a nové brýle Vision Pro
Zprávy z firem
PODZIMNÍ NEWSTREAM CLUB PRÁVĚ VYCHÁZÍ
Jak se udržet v kondici a vytvářet dlouhodobou hodnotu? Snaha udržovat se v souladu s nároky doby je hlavní téma aktuálního magazínu Newstream CLUB, který nyní vychází, s podtitulem VYJEDNEJTE SI SVŮJ ŽIVOT.
Proč se vyjednávání stává jednou z hlavních dovedností pro budoucí úspěch, vysvětlí přední český vyjednavač a titulkový muž Radim Pařík.
Na otázku ‚Jak zůstat relevantní i v dalších letech?‘ odpovídají i další osobnosti byznysu, showbyznysu, ale také medicíny. Například vyhlášená pohybová lékařka Karolína Velebová, která se stará o řadu vrcholových sportovců včetně olympioniků. Dědička kávového impéria Christina Meinl ukazuje na historii legendární firmy, jak důležité bylo pro její přežití a dlouhodobý úspěch ochota radikálně se změnit a začít znovu téměř od nuly.
Partner Penta Investments Václav Jirků popisuje, jak důležitou roli bude hrát soukromý sektor ve zdravotní péči a sociálních službách.
O duševním zdraví, wellbeingu a o tom, jak jich dosahovat pomocí moderních technologií, hovoří Jiří Diblík, spolutvůrcem globálně úspěšné wellbeingové a mental health aplikace VOS Health.
Páté vydání čtvrtletníku Newstream CLUB je v prodeji na stáncích i v online distribuci Send, kde je možné titul také předplatit. Digitální verzi magazínu lze zakoupit přímo na webu newstream.cz.
Na další číslo se můžete těšit již v prosinci.