מדריך פרקטי לבניית פרומפטים טובים יותר ליצירת תמונות עם GPT

מדריך: איך לכתוב פרומפטים מעולים ליצירת תמונות עם GPT

איך לכתוב פרומפטים טובים יותר לתמונות, בצורה פשוטה, ברורה ושימושית גם ליצירה חדשה וגם לעריכה.

מאת מאי רייזמן, ScaleUp. מדריך פרקטי שמרכז עקרונות כתיבה, שיטות עבודה ודוגמאות שימוש שאפשר לקחת ישר לעבודה אמיתית.

אם אתם כבר עובדים עם מודלי תמונה ורוצים פחות ניסוי וטעייה ויותר שליטה בתוצאה, זה מקום טוב להתחיל ממנו. הדגש כאן הוא על ניסוח ברור, שמירה על אילוצים, ועבודה חכמה עם פרומפטים ועם תמונות קלט.

לקביעת שיחת היכרות בחינם לקריאת המדריך

מאי רייזמן

אני חי את החיבור בין אסטרטגיה, תהליכים ובינה מלאכותית.

המטרה שלי היא להראות איך אפשר להשתמש ב-AI לא רק כדי לקבל תשובות, אלא כדי לבנות מערכות עבודה חכמות שחוסכות זמן ומייצרות יותר דיוק.

המדריך הזה מרכז שיטות כתיבה ודוגמאות שימוש שיעזרו לכם להוציא תוצאות טובות יותר ממודלי תמונה, בלי להסתבך עם ניסוחים כלליים מדי.

ScaleUp Image Prompting Workflow Design

המדריך הזה מתחיל ישר מהחלק שבאמת עוזר בעבודה: איך כותבים פרומפטים טובים יותר. בלי להיתקע יותר מדי על רקע, פרמטרים והשוואות בין מודלים, ועם פוקוס על מה שעוזר בפועל לייצר ולערוך תמונות בצורה טובה יותר.

תמצאו כאן עקרונות עבודה ודוגמאות שימוש נפוצות ליצירה מטקסט, לעריכה מתמונה, ולתהליכים קצת יותר מתקדמים.

הכי נכון לעבוד בצורה הדרגתית: להתחיל מפרומפט בסיסי, לשנות בכל פעם רק דבר אחד, ובכל סבב להזכיר מחדש מה חייב להישאר אותו דבר.

רוצה לבנות workflows כאלה אצלך?

יסודות

יסודות כתיבת פרומפטים לתמונות

ברוב המקרים, השיפור האמיתי לא מגיע מפרומפט ארוך יותר אלא מפרומפט ברור יותר. כשמגדירים את הסצנה, את הנושא המרכזי, את הפרטים החשובים ואת האילוצים בצורה מסודרת, הרבה יותר קל לקבל תוצאה טובה כבר מהסבב הראשון ולשפר אותה אחר כך בלי להתבלבל.

מבנה ומטרה: כדאי לכתוב בסדר קבוע: מה רואים ברקע, מה הנושא המרכזי, אילו פרטים חשובים באמת, ורק אז מה אסור שישתנה. עוזר גם לציין למה התמונה מיועדת, למשל מודעה, אינפוגרפיקה או מוקאפ.
פורמט הפרומפט: לא חייבים פורמט "נכון". אפשר לכתוב פסקה אחת, כמה שורות קצרות או מבנה מסודר. מה שחשוב הוא שהכוונה תהיה ברורה וקל יהיה לחזור לטקסט ולשפר אותו.
דיוק ואיכות: עדיף להיות ספציפיים. במקום לכתוב "תמונה יפה", עדיף לכתוב אילו חומרים, טקסטורות, תאורה וסגנון אתם רוצים. אם המטרה היא מראה מציאותי, שווה לכתוב במפורש photorealistic.
מהירות מול איכות: אם צריך תוצאה מהירה או הרבה וריאציות, אפשר להתחיל עם quality="low". אם יש טקסט קטן, פרטים צפופים, פנים או עבודה רגישה, לרוב שווה לנסות גם medium או high.
קומפוזיציה: שווה להגדיר מאיפה רואים את הסצנה, כמה קרוב המצולם, מה סוג התאורה ואיפה ממוקם הנושא המרכזי. הפרטים הקטנים האלה עושים הבדל גדול.
אנשים, תנוחה ופעולה: כשיש אנשים בתמונה, כדאי לציין איך הם עומדים, לאן הם מסתכלים, מה רואים מהגוף, ואיך הם מחזיקים או נוגעים באובייקטים.
מה לשנות ומה לשמור: בעריכות, חשוב להגיד בצורה מאוד מפורשת מה צריך להשתנות ומה חייב להישאר בדיוק כמו שהוא.
טקסט בתוך תמונה: אם חשוב שמילים יופיעו נכון, כדאי לשים אותן במרכאות ולהגדיר סגנון, גודל, צבע ומיקום.
עבודה עם כמה תמונות: כשמשתמשים בכמה קבצי קלט, כדאי להתייחס לכל תמונה לפי מספר ותפקיד, כדי שלא יהיה בלבול.
לעבוד בהדרגה: במקום לדחוס הכול לפרומפט אחד ענק, עדיף להתחיל נקי, לבדוק תוצאה, ואז לדייק כל פעם נקודה אחת.

הגדרה

Setup בסיסי לעבודה עם יצירת תמונות

כדי להתחיל לעבוד בצורה מסודרת, הנה קטע בסיסי שמגדיר לקוח API, יוצר תיקיות לקבצי קלט ופלט, ומוסיף פונקציה קטנה לשמירת התמונה שחוזרת. אם אתם עובדים במחברת או בסביבת ניסוי, זה בסיס נוח להתחלה.

import os
import base64
from openai import OpenAI

client = OpenAI()

os.makedirs("../../images/input_images", exist_ok=True)
os.makedirs("../../images/output_images", exist_ok=True)

def save_image(result, filename: str) -> None:
    """
    שומר את התמונה הראשונה שחזרה לקובץ בתוך output_images.
    """
    image_base64 = result.data[0].b64_json
    out_path = os.path.join("../../images/output_images", filename)
    with open(out_path, "wb") as f:
        f.write(base64.b64decode(image_base64))

from IPython.display import HTML, Image, display

def display_image_grid(items, width=240):
    cards = []
    for item in items:
        title = item.get("title", "")
        label = f'<div style="font-weight:600;margin-bottom:8px">{title}</div>' if title else ""
        cards.append(
            '<div style="text-align:center">'
            + label
            + f'<img src="{item["path"]}" width="{width}" style="max-width:100%;height:auto;" />'
            + '</div>'
        )
    display(HTML('<div style="display:flex;flex-wrap:wrap;gap:16px;align-items:flex-start">' + ''.join(cards) + '</div>'))

הגדרת לקוח

←

input_images

←

output_images

←

save_image

יצירה

שימושים נפוצים ליצירה מתיאור טקסט

כשעובדים עם יצירה מטקסט, הכי נכון לחשוב כמו על בריף מסודר: מה התוצר, למי הוא מיועד, מה חייב להופיע, ומה לא אמור להיכנס פנימה. הדוגמאות כאן עוזרות לראות איך אותו עיקרון עובד על סוגים שונים של תוצרים.

אינפוגרפיקות

מתאים להסברת מידע מובנה לסטודנטים, מנהלים, לקוחות או קהל רחב. מומלץ להשתמש באיכות גבוהה כשיש הרבה טקסט בתמונה.

פוטוריאליזם טבעי

כדאי לתאר צילום אמיתי, מרקמים לא מושלמים, תאורה טבעית ותחושה לא מבוימת כדי לקבל תוצאה משכנעת יותר.

מודעות, לוגואים ו-UI

עובד טוב כשכותבים כמו בריף קריאייטיב או מפרט מוצר, עם טקסט מדויק, היררכיה ויזואלית ואילוצים ברורים.

דוגמה 4.1

אינפוגרפיקה

אינפוגרפיקות טובות מתחילות במטרה ברורה ובפירוט של מה צריך להופיע בהן. אם חשוב שהתוצאה תהיה גם טכנית וגם ויזואלית, כדאי להגיד את זה במפורש ולא להניח שהמודל יבין לבד.

prompt = """
Create a detailed Infographic of the functioning and flow of an automatic coffee machine like a Jura.
From bean basket, to grinding, to scale, water tank, boiler, etc.
I'd like to understand technically and visually the flow.
"""

result = client.images.generate(
    model="gpt-image-2",
    prompt=prompt,
    size="1024x1536",
    quality="medium",
)

save_image(result, "infographic_coffee_machine_gpt-image-2.png")

דוגמה 4.2

תרגום טקסט בתוך תמונה

זה אחד השימושים הכי פרקטיים כשרוצים להתאים עיצוב קיים לשפה אחרת בלי לבנות הכול מחדש. הרעיון הוא לבקש להחליף רק את הטקסט, ולשמור על המבנה, הטיפוגרפיה והאלמנטים הגרפיים כמו שהם.

prompt = """
Translate the text in the infographic to Spanish. Do not change any other aspect of the image.
"""

result = client.images.edit(
    model="gpt-image-2",
    image=[
        open("../../images/output_images/infographic_coffee_machine_gpt-image-2.png", "rb"),
    ],
    prompt=prompt,
    size="1024x1536",
    quality="medium",
)

save_image(result, "infographic_coffee_machine_sp_gpt-image-2.png")

דוגמאות 4.3-4.10

עוד שימושים חזקים ליצירה מטקסט

מכאן העיקרון כבר חוזר על עצמו שוב ושוב: ככל שמגדירים יותר טוב את סוג התוצר, את ההקשר ואת מה שחשוב להבליט או לשמור, כך התוצאה מדויקת יותר. אלה כמה שימושים בולטים שכדאי להכיר:

פוטוריאליזם טבעי: לתאר צילום קנדיד עם מרקמי עור, בלאי בחומרים, תאורה רכה ואיזון צבעים טבעי.
ידע עולם: אפשר לבקש סצנה בזמן ובמקום מסוימים, והמודל ישלים הקשר היסטורי או תרבותי רלוונטי.
יצירת לוגו: מנסחים אישיות מותג, שימוש, מגבלות על מורכבות, שליליות חלל וקריאות בגדלים שונים.
מודעות פרסום: כותבים כמו בריף קריאייטיב עם קהל יעד, וייב, קומפוזיציה, וטקסט מילולי מדויק שמופיע בתמונה.
קומיקס מסיפור: מפרקים את העלילה לביטים ברורים, פאנל אחרי פאנל, עם פעולה קונקרטית בכל שלב.
מוקאפ UI: מתארים מוצר קיים, לא קונספט ארט, ומתמקדים בהיררכיה, מרווחים ורכיבים אמיתיים.
ויז'ואלים מדעיים וחינוכיים: מפרטים קהל יעד, מטרת למידה, תוויות נדרשות, והדברים שאסור להכניס.
שקפים, דיאגרמות וגרפים: נותנים את המספרים, הטקסטים וההיררכיה ישירות בפרומפט כדי לקבל תוצר שנראה כמו מסמך עבודה אמיתי.

כשברור מה רוצים, גם הסבב הראשון מרגיש הרבה פחות כמו ניחוש.

כשיש שילוב טוב של מטרה, סגנון, קומפוזיציה ואילוצים, המודל לא צריך "לנחש" למה התכוונתם. זה ההבדל בין תוצאה יפה שיצאה במקרה לבין תהליך עבודה שאפשר באמת לחזור עליו.

לקביעת שיחת היכרות בחינם

עריכה

שימושים נפוצים לעריכת תמונות עם טקסט ותמונה

בעריכת תמונות, כמעט תמיד יש שני חלקים שצריך לנסח טוב: מה בדיוק משתנה, ומה חייב להישאר אותו דבר. ככל שהעריכה עדינה ומדויקת יותר, כך חשוב יותר לכתוב את זה בצורה מפורשת.

מה לשנות

אובייקט, בגד, טקסט, מזג אוויר, תאורה או רקע.

מה לשמר

זהות, זווית מצלמה, קומפוזיציה, פרופורציות, תאורה יחסית ופרטי מותג.

דוגמה 5.1

העברת סגנון

זה שימוש מעולה כשיש לכם רפרנס שאתם אוהבים את השפה הוויזואלית שלו, אבל רוצים להחליף את הדמות או את הסצנה. כדאי להגיד מה נשמר מהסגנון ומה מתחלף, כדי שהתוצאה לא תיסחף לכיוון אחר.

prompt = """
Use the same style from the input image and generate a man riding a motorcycle on a white background.
"""

result = client.images.edit(
    model="gpt-image-2",
    image=[
        open("../../images/input_images/pixels.png", "rb"),
    ],
    prompt=prompt,
    size="1024x1536",
    quality="medium",
)

save_image(result, "motorcycle_gpt-image-2.png")

דוגמה 5.2

מדידת בגדים וירטואלית

כאן שימור הזהות הוא הדבר הכי חשוב. צריך להגיד במפורש שהפנים, הגוף, התנוחה, השיער וההבעה נשארים כמו שהם, ורק הבגדים מתחלפים בצורה שנראית טבעית ומשתלבת טוב באור ובצל.

prompt = """
Edit the image to dress the woman using the provided clothing images. Do not change her face, facial features, skin tone, body shape, pose, or identity in any way. Preserve her exact likeness, expression, hairstyle, and proportions. Replace only the clothing, fitting the garments naturally to her existing pose and body geometry with realistic fabric behavior. Match lighting, shadows, and color temperature to the original photo so the outfit integrates photorealistically, without looking pasted on. Do not change the background, camera angle, framing, or image quality, and do not add accessories, text, logos, or watermarks.
"""

דוגמאות 5.3-5.9

שימושי עריכה נוספים שכדאי להכיר

סקיצה לתמונה: שומרים פרספקטיבה ופרופורציות, ומוסיפים חומרים, תאורה וסביבה ריאליסטיים.
מוקאפ מוצר: מחלצים מוצר לרקע לבן אטום, שומרים חדות תווית וגיאומטריה, ומוסיפים הצללה עדינה בלבד.
קריאייטיב שיווקי עם טקסט אמיתי: מגדירים טקסט מדויק במרכאות, טיפוגרפיה, מיקום ואיסור על טקסט נוסף.
שינוי תאורה ומזג אוויר: משנים רק תנאי סביבה כמו שלג, ערב, עננות או רטיבות, בלי להזיז את הסצנה.
הסרת אובייקט: בקשה קצרה ומפורשת כמו "הסר את הפרח מהיד, אל תשנה שום דבר אחר".
הכנסת אדם לסצנה: דורש תיאור פוטוגרפי אמין, שימור זהות, התאמת קנה מידה, אור ותחושת מציאות.
קומפוזיט מריבוי תמונות: מגדירים איזה אלמנט מועבר מאיזו תמונה, לאן, ומה לא משתנה בסביבה.

ערך נוסף

שימושים מתקדמים עם ערך גבוה

מעבר לדוגמאות הישירות, יש גם כמה תהליכים מתקדמים שבהם כתיבה טובה של הפרומפט עושה הבדל ממש גדול:

החלפת רהיטים בעיצוב פנים

עריכה מדויקת של אובייקט בודד בחלל אמיתי, תוך שמירה על זווית מצלמה, הצללות והקשר סביבתי.

כרטיס ברכה או מוצר עונתי

מתאים לקונספטים שיווקיים עם דגש על חומריות, קיפולים, סיבים, תאורת סטודיו ואווירה פיזית אמינה.

ספר ילדים עם עקביות דמות

יוצרים תחילה עוגן לדמות הראשית, ואז משתמשים בו שוב ושוב כדי להמשיך סיפור בלי שהדמות "תזוז".

מגדירים דמות, סגנון, פרופורציות ואילוצים כעוגן ראשוני.

מריצים יצירה ראשונה ששומרת על הרקע פשוט כדי לייצב את הזהות הוויזואלית.

משתמשים בתמונה שנוצרה כקלט לעריכות או להמשך עלילה עם אותן תכונות דמות.

חוזרים בכל סבב על רשימת הדברים שאסור לשנות כדי לצמצם drift.

סיכום עבודה

העקרונות שחוזרים כמעט בכל דוגמה

למרות שיש הרבה מאוד סוגי שימוש, בסוף כמעט כולם נשענים על אותם עקרונות: כתיבה ברורה, הפרדה בין מה שמשתנה למה שנשאר, ושיפור הדרגתי מסבב לסבב.

הגדירו את התוצר הסופי כאילו אתם כותבים בריף למעצב או לצלם.
כתבו אילוצים מפורשים על טקסט, מותגים, קומפוזיציה, זהות ואלמנטים שלא משתנים.
בעבודת עריכה, חזרו בכל איטרציה על רשימת השימור כדי למנוע drift.
בחרו איכות ו-fidelity לפי סוג המשימה, לא לפי תחושת בטן.
העדיפו שיפור חד-משתני בכל פעם על פני שכתוב אגרסיבי של כל הפרומפט.

פרומפט טוב לתמונה הוא פשוט דרך ברורה להסביר מה אתם רוצים.

זה נכון גם ליצירה חדשה וגם לעריכה. ככל שהמטרה, ההקשר, הסגנון והאילוצים מוגדרים טוב יותר, כך גם התוצאה הראשונה טובה יותר, וגם קל יותר לשפר אותה אחר כך בלי לאבד שליטה.

המדריך הזה מרכז את דפוסי העבודה שחוזרים שוב ושוב במקרי שימוש אמיתיים: אינפוגרפיקות, מודעות, UI, פוטוריאליזם, תרגום טקסט בתוך תמונה, החלפת אובייקטים וקומפוזיט של כמה תמונות יחד. זו נקודת פתיחה טובה לבנות ממנה דרך עבודה עקבית ואמינה עם מודלי התמונה של GPT.

לקביעת שיחת היכרות בחינם לחזרה לתחילת המדריך

ScaleUp Business Consulting · מדריך בעברית לכתיבת פרומפטים ליצירת תמונות ועריכת תמונות עם GPT