
6月27日,新闻新闻媒体Neawin今天(6月27日)发表了一篇博客文章,该文章报道说,在2025年I/O开发人员会议上之前的观看并启动之后,Google已正式启动了多模式模型Gemma 3N Endid Indid Photoge和视频。与5月份发布的预视图版本相比,Gemma 3N的最新完整版本提供了更好的性能,该版本以2 GB的内存为本地硬件操作,并着重于提高编码和推理功能。我引用了一篇家庭博客文章,并介绍了Gemma 3N有两个主要版本。其中,E2B共有50亿(5B)参数,承认它是在具有超过2 GB内存的设备上执行的。 E4B共有80亿(8B)参数,并承认具有3GB或更多内存的设备上的Axiscuta。通过建筑创新,记忆的使用量为20亿(2b)和40亿(4B)。当涉及体系结构时,Gemma 3n创新采用了机器的建筑To提供计算机的灵活性,并使用图层(PLE)来提高内存效率,Visual编码器Mobilenet-V5等。对于机械师的建筑,Google使用俄罗斯手腕的哲学家。最大的模型包括内部较小但功能齐全的版本,该版本允许单个模型根据不同的任务以不同的尺寸运行。 Gemma 3N实现了改进的多语言质量(以140种语言兼容文本,并以35种语言的多模式理解),数学,编码和推理。从性能参考的角度来看,最大的E4B模型是第一个模型,其量较少的10B参数,但得分超过1300。该模型的音频使用编码器在设备上使用可以处理我开始使用的详细语音的编码器上呈现了音频的文本和翻译。视觉外观配备了一个名为Mobilenet-V5的新编码器。这比前几代更快,更有效。处理视频可达60 fps您的Google像素设备。