Stable Diffusion WebUI (Automatic1111) – Teil 1

Ich hatte mich ja schon kurz über AI Art und Urheberrecht ausgelassen. Und nun  will ich mal ein bisschen zu den praktischen Seiten bloggen. Schon allein um mich mal näher mit den Hintergründen zu befassen aber auch um meine Erfahrungen mit mehreren tausend erstellten Bildern.

Gekommen bin ich zu AI Art über die Software Visions Of Chaos. Damit habe ich viel Fraktalbilder gemacht und auch andere Simulationen. Und es gibt dort halt auch ein Kapitel „Machine Learning“. Und da mein damaliger PC nicht in der Lage war (zu alte Grafikkarte) damit zu arbeiten, habe ich nach anderen Möglichkeiten gesucht und diese auch gefunden. Midjourney und Nightcafestudio sind solche Möglichkeiten. Mittlerweile habe ich mich modernisiert und kann zumindest eine Vielzahl der Programme aus Visions of Chaos lokal ausführen. Und ein Hauptwerkzeug ist die Stable Diffusion WebUI von Automatic1111 (die auch in Vision of Chaos enthalten ist). Und ich werde mich in mehreren Beiträgen in loser Folge mit dieser Oberfläche und Ihren Möglichkeiten beschäftigen.

Das erste Bild zeigt die WebUI mit dem aktivierten text2image Tab. Links oben findet sich die Auswahl des Modells, welches man für die Bildgenerierung benutzen möchte.

Die Modelle (technisch Checkpoints) findet man in seiner lokalen Installation im Verzeichnis stable-diffusion-webui\models\Stable-diffusion. Man kann sowohl Dateien der Form .ckpt als auch .safetensors verwenden. Viele solcher Modelle (basierend auf den Originalmodellen von stability.ai) findet man unter anderem auf Civitai. Wichtig: Lädt man Modelle bei geöffneter WebUI dann muß man den Reload-Button rechts neben dem aktuell gewählten Modell drücken. Dann wird die Liste der verfügbaren Modelle neu geladen.

Als nächstes kommen zwei große Eingabefelder für den Prompt und einen negativen Prompt. Hier wird im Prinzip einerseits beschrieben, was das Bild zeigen soll und was es nicht zeigen soll. Dabei können von Modell zu Modell unterschiedliche Tag Systeme (Danbooru oder CLIP) zum Einsatz kommen. Hier bin ich selber noch am Lernen, ich will jedoch mal versuchen die Unterschiede an einem Beispiel aufzuzeigen. Dazu habe ich  das folgende von mir generierte Bild genommen:

Im Tab img2img kann man Bilder hochladen und sich entsprechende Prompts generieren lassen.

Für das CLIP Modell ergibt sich dabei folgender Prompt: a loaf of bread with a bite taken out of it on a table next to a window with a green wall, Brian Snøddy, product photo, a pastel, precisionism

Für das DeepBooru Model erhält man dagegen: food, no_humans

"verwendete Still life with bread roll,(Heidelberg School:1.3) Negative prompt: stock image, blocks, jpeg, jpg, dusty particles, blurry, smooth, smudges, frame, words, text, signature, watermark, paint brush, drawing pad,watermark,signature Steps: 50, Sampler: DPM++ SDE, CFG scale: 12.5, Seed: 4111621769, Size: 910x512, Model hash: 0fc198c490, Model: AbyssOrangeMix2_hard, aesthetic_score: 5.9

Nun kann man eigentlich schon mit den voreingestellten Parametern loslegen.

Im nächsten teil werde ich dann ein wenig (soweit mir möglich) auf eben jene Parameter eingehen.

Wer will, kann ja auch mal bei mir auf Discord vorbeischauen.

AI- Art

AI- Art ist zur Zeit ein großes Thema. Bilder werden von unzähligen Nutzern erstellt und das mit durchaus anspruchsvollen Motiven. Die breite Verfügbarkeit hat natürlich auch zu Diskussionen zum Für und Wider dieser Kunstform geführt. Und so ist es nicht verwunderlich, dass es halt auch viel Ablehnung gibt. Ich möchte mal behaupten, das nicht jeder der diese Form der Kunst ablehnt, sich schon einmal daran versucht hat. Man kann natürlich schnell Erfolge erzielen. Aber, so zumindest beobachte ich es an mir, wird man mit der Zeit anspruchsvoller. Und man beginnt damit zu probieren, wie weit man die AI steuern kann. Man experimentiert halt mit den verschiedenen Schlagwort, und derer gibt es viele. Ein bisschen so, wie der klassische Maler mit Pinseln und Farben experimentiert. Und somit kann ich nachvollziehen, das der „klassische“ Künstler skeptisch dieser Kunstform gegenüber steht, sich sogar teilweise in seiner Existenz bedroht fühlt. Und so kommt es nun auch in der Malerei zu ähnlichen Diskussionen wie man sie unter Musikern hatte, als die Tauschbörsen aufkamen. Aber man muß auch klar sagen, AI- Art erlaubt vielen Menschen auch den Zugang zur Schaffung von Kunst, die es auf traditionellen Werk nie hinbekommen würden. Und ich gehöre definitiv dazu. Also kann man zwar versuchen, AI-Art zu verbieten und verbannen. Ich halte das für kleingeistig und ich bin überzeugt, das AI-Art Bestandteil unserer Kultur wird. Genauso wie andere Formen digitaler Kunst.

Und wer mal sehen will, was ich so mache, der kann das auf kunst.sthomas.de als auch auf deviant-Art tun.

Covid 19 und kein Ende

Es ist denke ich wieder Zeit, das ich das eine oder andere niederschreibe. Und Covid19 hat uns ja lange beschäftigt. Jetzt endlich sind die meisten Beschränkungen gefallen. Ist nun alles besser oder gar vorbei? Laut RKI haben wir derzeit eine 7 Tage Inzidenz von 566,8, was 471289 Fällen in 7 Tagen entspricht. Das heißt knapp eine halbe Millionen Bürger infizieren sich nachweislich mit dieser Krankheit. Nach nicht ganz gesicherten Zahlen sind 15% der Patienten auch von Post- Covid Syndrom betroffen, das heißt sie haben nach mehr als 12 Wochen noch Symptome. In Zahlen bedeutet das, das ca. 75000 Bürger dieses Landes alleine an Covid für mehr als 12 Wochen erkranken. Nach der Gutenberg-19 Studie geben sogar 40% der mit SARS-CoV19 infizierten Patienten an, das Symptome durchaus mehr als 6 Monate anhalten können (Quelle: https://www.herzstiftung.de/ihre-herzgesundheit/coronavirus/post-covid-herzschaden-therapie). Und das sind nur allgemeine Zahlen. Brauchen wir also doch mehr Lockdown, mehr Masken etc.? Ich denke nicht. Jedoch liegt das nicht an einer Harmlosigkeit der Erkrankung, sondern daran, das Dank Impfung und anderer Entwicklungen die Medizin zumindest die derzeit grassierenden Varianten unter Kontrolle hat. Die Maskenpflicht fand ich zumindest teilweise übertrieben. Aerosolforscher haben schon frühzeitig darauf hingewiesen, das man im Freien eigentlich keine Maske braucht. Insofern waren meiner Meinung nach viele Maßnahmen inklusive Einschränkungen beim Versammlungs-und Demonstrationsrecht unangemessen. Anders dagegen in Innenräumen. Hier scheint sich der erhöhte Hygienestandard positiv ausgewirkt zu haben. Zumindest sind wohl Grippe- und Erkältungskrankheiten quasi als Nebeneffekt zurück gegangen. Vielleicht sollten wir da (freiwillig) in der kalten Jahreszeit zurück greifen. Und es müssen ja auch nicht die Einkaufstempel mit Menschen vollgestopft werden. Eine Obergrenze an Kunden pro Verkaufsfläche halte ich durchaus generell für sinnvoll. Was Impfungen betrifft, so halte ich noch immer die mRNA – Impfstoffe für eine revolutionäre Tat. Ich bin überzeugt, das ohne diese Impfstoffe wir deutlich mehr Opfer weltweit zu beklagen hätten (offiziell 6,2 Millionen Tote weltweit. Laut einer Studie in The Lancet starben weltweit von Januar 2020 bis Dezember 2021 18,2 Millionen Menschen mehr als in nicht Pandemiezeiten (entnommen aus: https://www.hna.de/welt/corona-covid-tote-studie-weltweit-pandemie-dunkelziffer-hoch-hna-news-zr-91404246.html). Im Vergleich dazu kostete der erste Weltkrieg etwa 10 Millionen Todesopfer, die zum Ende des Weltkrieges grassierende spanische Grippe riss nach neueren Schätzungen zwischen 50 und 100 Millionen Menschen aus dem Leben. Also so harmlos ist SARS-CoV19 wohl doch nicht, denn Verglichen mit der Situation von vor 100 Jahren haben wir heute eine völlig andere medizinische Versorgung zur Verfügung und auch eine meist sehr viel bessere Versorgungslage. Fazit: Die Zeichen stehen auf Entspannung, jedoch nicht auf Entwarnung oder wie man so schön sagt: „Holzauge sei wachsam!“