漫谈AI 模型生成图像

视频中的人物美术作品,全部是AI模型生成的。不同风格,以及不同风格的碰撞。

AI 生成并高清化的肖像 (8 MB)

AI 生成肖像作品(2MB)

txt2img 乍一看 也没啥,花里胡哨的,好像都是闹着玩的。不少“作品”感觉在前AI生成模型阶段,通过抄袭(侵犯版权)加PS也可以做。

但人们往往忽视了里面与PS的“质”的不同。

AI 模型生成的“艺术品”:(1) 绝不是抄袭,也不牵涉版权侵犯问题,因为 (2)AI 模型是 “消化” 了无数作品练就的生成“功夫”,换句话说,模型是把先人的作品揉碎了,变成具有不同级抽象能力的内部向量表示的模型,在此基础上的生成是不可能抄袭的,只可能是“再创作”。

可以说这与人类艺术家的修为和风格形成非常相似。人类艺术家也是在前人的肩膀上,多年苦练兼收并蓄最后形成自己的风格和功力。所不同的是,它的消化能力从容量上看 不知道要超过人类个体多少倍。

如果要押宝,对于艺术家个体 vs 对于 模型,’创造力 学识与风格多样性“ 我更倾向于后者。个体的“功力”有瓶颈,人的艺术生涯容易撞上天花板,江郎才尽。而模型这方面好多了。

老友:AI学会风格是不是创造力?

维:应该算的,最终图灵测试定音。等到以风格和创造力作为标准的大赛 越来越多ai作品上榜,盲选的话 那就难以为人类独特性辩护了。辩护的理由只剩下一条:来源上看,人类艺术是鸡 AI 是蛋。但哪个艺术家后生不是鸡蛋呢?没见过娘胎里一生下就成为艺术家的。天才也要苦练基本功才能绽放才华。

老友:风格实际上是韵律的规律性重复和一定的随机性的组合。人对于规律的把握存在个人极限,超越极限的部分表现出一定的随机性,实际上就是个人风格了。人的随机性表现是因为心情或者脉搏或者某一时间的注意力的漂移。比如拉小提琴的时候忽然憋尿也是会表现出一定的随机性,所以声音就会出现一定的散乱。但是这种随机性是不是AI也可以模拟。还有就是随机性掺入进去是真随机还是伪随机。

维:AI 生成模型的本性里就有随机性,因此同样的模型在相同的提示词与其他条件下可以寻不同路径生成多种结果。

艺术上所谓的残缺美,实际上就是为随机漂移留下了容忍、甚至欣赏的空间。 白璧无瑕没问题 白璧微瑕也没问题。

老友:音乐比较容易被AI生成,书画和中国书法最难。

维:ai 书法我也玩过,这是生成的怀素狂草:

感觉是初学水平或略好过初学。可是这不是特意学书法的模型生成的,而是大模型的副产品,没有特别针对书法做优化,所以还不错啦。(你放大看就发现,这是从形式上对于狂草笔法的模仿,里面其实没有一个汉字。)

毛泽东写了一辈子狂草,可是毛体狂草,书法界有不同评价,褒贬不一。贬的一方认为毛体根本没上路,也就是上面AI初学者的水平。

老友:中国书法里面蕴含了中国文人的文化特质和文化追求。

维:你这种说法是意义不大的真理。所有艺术都可以有类似的说法,说到底就是强调人类独特性(或神性)。但所有艺术都是诉诸形式表现,也都是可以AI的。

老友:@wei 中国文人的忧世情怀和自伤自怜是一种独特的民族特质

维:艺术的都是民族的,从书法 绘画 民间音乐 都可以强化这些民族风特质,但解剖刀下,以绘画论,最终归结于形式原子像素。

老友:可以尝试用大模型专门针对中国书法学习一下,看看能够学出来的结果怎么样,应该是像素的矢量表示。

维:国家基金应该支持这样的项目。

老友:这个得是文化部门的领导感兴趣才行。

维:

 

这幅作品 刚出来的时候 有些震撼,缺陷是鼻子嘴巴下的白线,不知道咋回事。

老友:点阵模型是模拟不好的,得用像素矢量模型才行。

维:现在模型都是矢量表示。像素是对内部表示渲染生成的结果。

去掉了白线,也把那根生成糟糕的手指去了,这些 ps 都是物理操作在点阵上进行,不像AI模型在内部向量上做文章。但点阵PS作为局部后编辑,还是有效的。

我玩的这模型是个明显针对人脸优化的模型,适合人体肖像艺术。目前该模型肢体仍然常出问题。看几幅失败之作:

全部有肢体问题,不是残疾便是出生问题:多生出或少了肢体。

即便有这些缺陷,如果我是美术家,还是可以通过这类模型找到更多的构图灵感。肢体虽然错乱,但远远看去环境与人物是和谐的,艺术家根据可以无限生成的模型样品 精选以后再创作,不仅效率会提高,脑洞也可以大开,因为有那么多不同组合和碰撞可以试验。

《朝华午拾》电子版

发布者

liweinlp

立委博士,计算语言学家,多语言多领域自然语言处理(NLP)资深架构师。Trend 首席科学家,聚焦医疗领域病友社区的媒体挖掘。前弘玑首席科学家,聚焦RPA+AI的NLP低代码多领域落地,设计NLP核心引擎雕龙,落地多领域场景,包括金融、电力、航空、水利、客服等。前讯飞AI研究院副院长,研发支持对话的多语言平台,前京东主任科学家, 主攻深度解析和知识图谱及其应用。Netbase前首席科学家,期间指挥研发了18种语言的理解和应用系统。特别是汉语和英语,具有世界一流的解析(parsing)精度,并且做到鲁棒、线速,scale up to 大数据,语义落地到数据挖掘和问答产品。Cymfony前研发副总,曾荣获第一届问答系统第一名(TREC-8 QA Track),并赢得17个小企业创新研究的信息抽取项目(PI for 17 SBIRs)。立委NLP工作的应用方向包括大数据舆情挖掘、客户情报、信息抽取、知识图谱、问答系统、智能助理、语义搜索等等。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据