DeepSeek 虽然相对较新,但已在人工智能市场上崭露头角。在 Janus-Pro-7B 的帮助下,DeepSeek 正在图像生成领域掀起波澜。通过分配不同的系统来理解视觉效果并进行创作,Janus Pro 已经能够制作出令人陶醉的图像。在本篇文章中,我们将进一步了解 Janus-Pro,看看如何使用 DeepSeek 生成图像。

教程:如何使用 DeepSeek 生成图像

什么是 Janus-Pro DeepSeek?

DeepSeek AI 的 Janus-Pro 是一种先进的人工智能模型,既能理解也能生成图像和文本。与传统模型不同,它将视觉处理分为两个不同的系统:一个用于解释图像,另一个用于创建图像。这种分工使 Janus-Pro 能够更准确地处理这两项任务,从而更有效地生成高质量的视觉效果和有意义的文本。

该模型使用 DeepSeek-LLM 处理文本,使用 SigLIP-L 作为视觉编码器,这意味着它可以在处理高分辨率图像的同时,保持对文本的深入理解。它的双通道架构确保了多模态理解和生成之间的无缝整合,使其在艺术创作、内容写作和人工智能辅助图像解读等任务中大显身手。

如何使用 DeepSeek 生成图像

如果想使用DeepSeek生成图像,可以采用以下方法之一:

  1. 使用 “Hugging Face”试用 Janus-Pro
  2. 在本地运行 Janus-Pro

让我们详细谈谈它们。

1、使用 “Hugging Face” 尝试 Janus-Pro(需魔法

使用 “Hugging Face” 尝试 Janus-Pro

如果您只想测试 Janus-Pro,而不想创建任何账户,Hugging Face 是您的最佳选择。您可以访问 huggingface.co 并使用该工具。点击超链接进入网站后,你会看到两个选项: 多模态理解和文本到图像生成。

通过这种多模态理解,您可以上传图片,如照片、图表或备忘录,并提出相关问题。例如,你可以上传一张繁忙的街道照片,然后问 “有多少人戴帽子?”或者分享一张图表,然后要求 “总结主要趋势”。该模型会对图片和您的文本进行分析,从而提供详细的答案和见解。

如何下载和安装 Windows 11 24H2 版本

文本到图像生成功能可让您使用简单的提示创建新图像,例如 “创建一张《龙珠 Z》中悟空与《WWE》中布洛克-莱斯纳战斗的图像”。您可以根据需要调整大小或风格等设置。该模型能生成高质量的图像(如 1024×1024 像素),非常适合设计徽标、头脑风暴游戏角色或将创意可视化。

2、在本地运行 Janus-Pro

在本地运行 Janus-Pro

现在,如果您对演示版感到满意,就可以在本地计算机上安装 Janus-Pro。 不过,在本地安装 Janus-Pro 之前,您必须确保您的计算机满足以下系统要求。

  • GPU:具有 16GB+ VRAM 的 NVIDIA GPU(例如 RTX 3090/4090)。
  • 内存:最低 16GB(推荐 32GB)。
  • 存储:20GB+ 可用空间用于模型和依赖项。
  • 系统: Windows 11/10
  • 工具:
    • Python 3.10+(在安装过程中启用了“添加到 PATH”)。
    • CUDA 工具包(与您的 GPU 驱动程序版本匹配)。
    • Microsoft Visual C++ 生成工具(用于编译包)。

为此,您必须遵循以下步骤:

  • 您需要有 Python 3.10+ 和 Windows 版 Git。
  • 然后从 developer.nvidia.com 安装 CUDA,从 visualstudio.microsoft.com 安装 Visual Studio,确保勾选 “使用 C++ 进行桌面开发”。
  • 现在,我们需要设置环境。您可以在任何地方运行这些命令,但最好在项目目录下打开 Visual Studio Code。
    python -m venv janus_env
    janus_env\Scripts\activate
  • 然后,我们必须使用以下命令在环境中安装依赖项。
    pip install --upgrade pip

    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118  
    # Replace "cu118" with your CUDA version

    pip install transformers sentencepiece accelerate

    注:在此,我们将升级 PIP,安装 Pytorch,然后安装 HuggingFace 库。

  • 现在,在 Visual Studio Code 的同一环境中,创建一个新的 Python 文件,并将其命名为 download-Janus.py。
    from transformers import AutoModelForCausalLM, AutoTokenizer
    
    model_name = "deepseek-ai/Janus-Pro-7B"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    print("Model downloaded!")
  • 然后,您必须运行脚本,让它下载模型。

这就是下载 DeepSeek Janus Pro 7B 的方法。

下载 DeepSeek Janus Pro 7B 的方法

如果您想测试模型,可以运行以下脚本:

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "deepseek-ai/Janus-Pro-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name).cuda() # Move to GPU
# Generate an image from text
input_text = "A cyberpunk city with neon lights and flying cars"
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_length=150)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("Generated description:", response)
model_name = "deepseek-ai/Janus-Pro-7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
print("Model downloaded!")

希望在本篇文章的帮助下,您能够使用 DeepSeek 生成图像。

[在线应用] 苹果heic图片怎么转成jpg_苹果heic图片转成jpg教程