《山巅周刊》定期分享科技、医学及人文资讯,以及最新商业智慧和实践。每周日发布。
目前的生成式人工智能系统(如 ChatGPT、Bard 等)存在根深蒂固的可用性问题,以至于需要非常善于表达的专业人员——Prompt Engineer——才能编写提示(Prompt)所需的文本,从而使人工智能输出期望的结果。
这种通过提示驱动的用户界面来获得基于意图的结果引起了尼尔森诺曼集团(Nielsen Norman Group,NN/g)的关注,其联合创始人雅各布·尼尔森(Jakob Nielsen)撰文称,人工智能正在引入计算历史上的第三种用户界面范式,转向一种新的交互机制:用户告诉计算机他们想要什么,而不是如何做,从而完全逆转了控制源。
范式 1:批处理
从计算机诞生(1945 年左右)开始, 第一个 UI 范式就是批处理。在这种范例中,用户指定了他们希望计算机执行的所有操作的完整工作流程。
范式 2:基于命令的交互设计
1964 年左右 ,分时技术的出现导致了第二种 UI 范式:基于命令的交互。在这种范例中,用户和计算机轮流执行一个命令,并发展了三代基本方法:命令行(如 DOS 和 Unix)、全屏基于文本的终端(常见于 IBM 大型机)和图形用户界面 (GUI:Macintosh、 Windows 和所有当前的智能手机平台)。
范式 3:基于意图的结果规范
在新的人工智能系统中,用户不再告诉计算机该做什么。相反,用户告诉计算机他们想要什么结果。
未来的人工智能系统可能会拥有一个混合用户界面 ,结合了基于意图和基于命令的界面元素,同时仍保留许多 GUI 元素。
基于意图结果规范的可用性
对于人工智能系统是否能够在基于意图的结果规范范式中实现高可用性,雅各布·尼尔森对此表示:提示驱动的人工智能用户体验损害可用性。
目前的生成式人工智能系统通过提示驱动的用户界面来获得基于意图的结果,即用户告诉计算机他们想要什么,而不是如何做。但这存在一个致命的可用性问题:用户必须非常善于表达才能编写提示(Prompt)所需的文本,以至于需要Prompt Engineer的工作来使人工智能输出期望的结果。这表明许多商业专业人士无法充分表达自己的需求,无法成功地使用当前的人工智能用户界面来解决最简单问题之外的任何问题。
根据最新的识字率研究,美国和德国等富裕国家的一半人口被归类为低识字率用户,其他中等收入国家的情况要糟糕得多,发展中国家的情况可能更糟糕。
对广大民众阅读技能的最佳研究是由经济合作与发展组织(OECD)进行的国际成人能力评估计划(PIAAC)调查。PIAAC 的数据包含 2011-12 年、2014-15 年和 2017-18 年在 33 个国家和地区的三轮调查结果,下图显示了成人识字率的分布情况。
- 红色和橙色部分代表识字的人(Level 0~2),但识字水平不高,无法推理或者低级推理。
- 蓝色(Level 3)具备在较大篇幅的文章中构建意义的能力,是代表真正阅读和处理文本能力的第一个级别。
- 绿色(Level 4~5)可以称之为学术水平的阅读技能,从复杂或冗长的连续、非连续、混合或多种类型的文本中整合、解释或综合信息;还能进行复杂的推理,并运用背景知识来解读文本。
在大多数富裕国家,只有 1% 的人口具备 Level 5,能够充分理解复杂的文本。
一般来说,写新的描述性散文比阅读和理解别人已经写好的散文更具挑战性。因此,猜测低表达能力用户的比例要高于低阅读能力用户的比例。
即使文化水平很高,以书面形式表达需求也很困难。作者根据数十年的企业软件开发经验提出,人类根本无法在规范文档中以任何程度的准确性陈述他们的需求。提示也一样。
预计,在美国、北欧和东亚等国家,只有不到 20% 的人能够用书面散文表达自己的观点,从而能够充分利用提示驱动的生成式人工智能系统。因为在这个问题上还缺乏更精确的数据,我的估计甚至是 10%。可以肯定的是,有一半人口的书面表达能力不足以很好地使用 ChatGPT。
尼尔森诺曼集团(Nielsen Norman Group,NN/g)是一家人机交互和用户体验咨询公司,其创始人之一唐·诺曼(Donald Norman)是美国认知科学、人因工程等设计领域的著名学者,以书籍《设计&日常生活》(The Design of Everyday Things)闻名于工业设计和互动设计领域,曾被《商业周刊》杂志评选为世界最有影响力的设计师之一及“可行技术大师”(Guru of Workable Technology),创造了用户体验(User Experience)这一术语。雅各布·尼尔森(Jakob Nielsen)是《用户界面设计的10 个可用性启发式方法》(10 Usability Heuristics for User Interface Design)的作者,1998年被《纽约时报》评为“网页可用性大师”,出版了《可用性工程》(Usability Engineering),被《互联网杂志》评为“可用性之王”(Guru of Usable Web Pages)。
人物:彼得·弗洛伊兴
彼得·弗洛伊兴(Peter Freuchen)是一位丹麦探险家、作家、记者和人类学家,他因其在北极探险(即“图勒探险”)中所发挥的作用而闻名。
1902 年至 1904 年,出生于格陵兰岛雅各布港的丹麦极地探险家和人类学家克努德·拉斯穆森(Knud Rasmussen)与作家Ludvig Mylius-Erichsen等四名丹麦探险家一起进行了第一次探险,称为“丹麦文学探险” ,以考察因纽特文化。回国后,他进行了巡回演讲,并撰写了《极地北方的人们》(The People of the Polar North,1908 年),这是一本结合了旅行日记和因纽特民间传说学术记录的书。拉斯穆森一生致力于对因纽特人及其语言、文化和历史的研究,对因纽特人歌曲和传说的翻译成为事实标准。
因纽特人(极地爱斯基摩人)是北极和亚北极地区的游牧民族,格陵兰因纽特人是公元 1100 年从加拿大迁徙而来的图勒人的后裔,现属欧盟公民。
拉斯穆森和弗洛伊兴
1886 年,弗洛伊兴出生于一个商人家庭,尽管他并不认真学习,但依然就读于哥本哈根大学并学习医学。弗洛伊兴在1906年退学了,因为他要作为丹麦文学探险队的一员首次前往格陵兰岛探险。弗洛伊兴在北极生活和探索方面的天赋引起了拉斯穆森的注意,拉斯穆森计划在格陵兰岛西北部当时被称为约克角区的地方建立一个贸易站,并邀请弗洛伊兴来管理它。
图勒贸易站
1910年,图勒贸易站成立,以古希腊和罗马神话传说中的北方之地命名,成为1912 年至 1933 年间一系列七次博学探险活动的大本营,这些探险活动被称为“图勒探险” (Thule Expeditions)。
弗洛伊兴在第一次图勒探险期间绘制的地图
图勒贸易站为弗洛伊兴带来了亲眼目睹丹麦殖民格陵兰岛的机会。而且,拉斯穆森是一位在格陵兰岛长大的丹麦和因纽特混血儿,会说因纽特语,并且知道如何处理一群雪橇犬,这有助于弗洛伊兴在格陵兰岛图勒与极地因纽特人一起生活了很多年,一名因纽特妇女成为他的第一任妻子。
弗洛伊兴和第一任妻子Navarana Mequpaluk
Peter Freuchen和Jens Fleischer弗洛伊兴的母亲娘家姓拉斯穆森。拉斯穆森的母亲是弗莱舍家族(Fleischer)的成员,这个家族从汉斯·埃格德(Hans Egede,18世纪传教士,他向格陵兰岛发起了宣教工作,这使他被称为格陵兰使徒)时代起就与格陵兰岛结下了不解之缘。延斯·弗莱舍(Jens Fleischer)是克努德·拉斯穆森的舅舅。
由于左脚严重冻伤,弗洛伊兴不得不于1926年截肢,与更多的北极探险失之交臂。他回到丹麦,买下了一个小岛Enehøje。正是在这里,他开始了自己的作家生涯,他写小说、文章、回忆录,甚至电影剧本,成群结队的人前来拜访。
1932年,弗洛伊兴返回格陵兰岛,这次探险是由美国米高梅电影制片厂资助的。他还受聘于电影业担任顾问和编剧,专门从事与北极相关的剧本,最著名的是米高梅(MGM)获得奥斯卡奖的《爱斯基摩人》(Eskimo,1933) ,影片改编自弗洛伊兴的著作《爱斯基摩人》(Der Eskimo)和《我们的土地》(Die Flucht ins weisse Land),弗洛伊兴饰演反派船长。
第二次世界大战期间,弗洛伊兴因参与丹麦对德国的抵抗而被监禁并被判处死刑,但他设法逃到瑞典并最终到达美国。1945 年,他与丹麦时尚插画家达格玛·科恩(Dagmar Cohn,1907-1991)结婚,科恩为《Vogue》和《Harper's Bazaar》等杂志工作。
一张由《Vogue》摄影师Irving Penn拍摄的著名照片中,弗洛伊兴留着胡子,穿着一件厚重的毛皮大衣。
弗洛伊兴是一位身材高大的维京人,身高六英尺七英寸,令人印象深刻。在另一张照片中,科恩在他的影子里。
Jes Stein Pedersen 是丹麦《政治日报》的文学编辑(弗洛伊兴曾在该报担任过大半生的记者),他解释了自己着迷的原因: "他似乎无所不能。他是船员、极地探险家、制图师、动物学家、电影制片人、贸易经理、记者、作家。他甚至一度是丹麦职业拳击联合会的领导人!此外,他还能与任何人交谈。他身上有一种既谦逊又高大的气质,让人们为之折服"。
1938年,他创立了丹麦冒险家俱乐部(丹麦语:Eventyrernes Klub),该俱乐部至今仍然存在,入会仪式上仍会响起据说来自他的木腿的敲击声。
《纽约时报》描述了弗洛伊兴的影响,称他可能是除了军事探险家Richard E. Byrd之外美国最著名的探险家。正如他在一本回忆录《流浪维京人》(Vagrant Viking,1953)中所描述的那样,他与斯堪的纳维亚半岛和其他国家的王室是朋友,他在纽约和好莱坞的电影工作使他进入了电影的“皇室”和华盛顿特区的政治世界。
参考资料:Peter Freuchen's beard @ ARCTIC Journal
阅读:JavaScript 框架的历史
在万维网的形成时期,网页只能是静态的。
1995 年,Netscape 公司决定向 Navigator 浏览器添加脚本语言,以实现浏览器加载页面后动态行为的能力,于是由 Brendan Eich 创建了 JavaScript 编程语言。
Netscape 向 Ecma International 提交了 JavaScript ,作为所有浏览器供应商都可以遵守的标准规范的起点。但微软于 1995 年推出了 Internet Explorer,并创建了自己的解释器 JScript,引发了与 Netscape 的浏览器战争。到 2000 年代初,Internet Explorer 的市场份额达到 95%,这意味着 JScript 成为 Web 客户端脚本事实上的标准。JavaScript 面临着挑战,开发人员只有在需要添加一些图形用户界面小部件或客户端验证时才会使用它。人们嘲笑它,认为它是一种低级语言,是 Java 的小跟班。不可否认,Brendan Eich 在设计这种语言时,本希望它能够平易近人;只是由于 Netscape 的营销策略,暗示它与热门的 Java 直接相关。
2005 年,开源社区的 Jesse James Garrett 发布了一份白皮书,他在白皮书中创造了 Ajax 一词,并描述了一系列技术(JavaScript 是这些技术的支柱),用于创建可在后台加载数据的网络应用程序,从而避免了重新加载整个页面的需要。这引发了 JavaScript 的复兴,许多新的库应运而生。2006 年 1 月,现在有些臭名昭著的 jQuery 库发布了,作者 John Resig 希望能够更轻松地在各种浏览器中使用 JavaScript。
Ryan Dahl 于 2009 年创建了 Node.js,这引发了 JavaScript 在网络浏览器之外使用量的大幅增长。
当前的 JavaScript 生态系统拥有许多库和框架、成熟的编程实践,而且 JavaScript 在网络浏览器之外也有大量使用。
我们生活在 JavaScript 的复兴时期。
Nicklas Envall的《JavaScript 框架的历史》(History of JavaScript Frameworks)带您踏上从1990年代至今的旅程,电子书以 EPUB 和 PDF 格式在 LeanPub 上提供。
AI的17种危险应用
娱乐业一直在讨论人工智能发展的利(如新艺术形式的兴起)和弊(无论是否得到表演者的许可,都可以复制表演者的脸和/或声音的深度伪造)。好莱坞正在大罢工,编剧工会 WGA 和演员工会 SAG-AFTRA 的诉求包括担心 AI 编剧、AI 换脸和 AI 配音。在游戏 Mod 发布网站 Nexus Mods,《上古卷轴 5》的许多 Mod 是基于真人配音演员声音由 AI 合成的配音,一些配音演员开始公开谴责未经允许情况下使用自己声音。
如Axios.com报道:配音演员Victoria Atkin为育碧公司 2015 年的冒险游戏《刺客信条:枭雄》(Assassin's Creed Syndicate)辛苦录制了虚构的 19 世纪自由战士Evie Frye的声音,现在有人利用人工智能让Evie说出了Bethesda公司 2011 年史诗巨作《上古卷轴 5:天际》(The Elder Scrolls V: Skyrim)中主角的所有台词。
俄勒冈州波特兰市的一家广播电台 Live 95.5 宣布,其午间主持人 Ashley Elzinga 将每天上午 10 点至下午 3 点向听众广播她声音的克隆版本(又名AI Ashley),此间她本人可能会在社区中做一些事情,管理社交帖子或处理数字资产或与工作相关的其他元素。(via TechCrunch.com)
我认为基于许可的声音复制和训练是一种有效工具,既节省成本,还提高质量,比如不会读错以及注入口水音。这只是一个关于AI取代人类工作的讨论,比如我更支持AI取代只念稿子的人类播音员,因为即使使用传统的Text-to-Speech技术就够了。
除了诸如以上工作替代的担忧,AI 的危险应用方式也正在被收集。
福布斯技术委员会的17位成员分享了一些令人惊讶甚至不安的人工智能应用方式,这些方式也许曾经我们不知道,但现在应该知道。
- 钓鱼信息和恶意软件
- 身份盗窃
- 日益复杂的网络攻击
- 造谣行为
- 泄露个人数据
- 名誉损害
- 冒充受信任的个人
- 操纵选举结果
- 自主武器系统
- 图像操纵
- 监视
- 对抗性攻击
- 更普遍和更具侵略性的广告
- 创建回声室
- 现实的数字影响者
- 创建合成数据
- 医学图像解读
工具:Wikipedia Simple English
维基百科有一个 Simple English 版本,使用简单的英语单词和语法。
Toosheh
Toosheh是一种卫星文件广播技术,它使用常见的卫星设备来传输数字内容,而无需依赖互联网访问。Toosheh 目前通过Yahsat Y1B卫星分发内容,覆盖中东大部分地区,除了传统的家庭电视卫星机顶盒之外,它不需要任何硬件,最低数据传输速率为 1 Mbit/s,因此每天可以传输数十 GB 的数据。
VFM
VFM(Veno File Manager)是一个极简且美观的多用户网盘程序,使用 PHP 文件管理器构建私有云。即插即用,无需数据库。
Flmngr
Flmngr 是免费的 PHP/Node 文件管理器,具有图像编辑器以及 Amazon S3 和 Azure Blob 支持。独立后端用于上传和选择文件、管理存储和编辑图像。支持自己的服务器存储。
类似的,Piwigo和4images是基于PHP 和 MySQL的网络图库管理系统;PhotoSwipe是一个JavaScript 图片库。
Easy Appointments
Easy Appointments(风格化为Easy!Appointments)是一款高度可定制的网络应用程序,运行在带有 PHP 和 MySQL 的 Web 服务器上,可让您的客户通过网络与您预约,并提供将数据与 Google 日历同步的功能。
GoldenDict
GoldenDict是一种开源的辞典软件,可为不同语言提供词汇、词组释义,其允许同时使用多种流行的辞典文件格式且无需转换,功能与StarDict(星际译王)类似,但更为活跃。GoldenDict提供免费的Windows版本和适用于 Android 设备的商业移动版本。
学习英语的读者可以进一步阅读酷玛实验室的文章《英语的计算机辅助语言学习(CALL)研究》。👍
「圆周率文化是个人站点,重点分享科技、商业、医学及人文资讯。
「圆周率文化得到中国汽车绞盘网的支持,深表感谢。中国汽车绞盘网业务始创于2001年,为越野车、清障车、消防车、军用车、特种车及工程应用等拖曳、救援场景提供手动绞盘、电动绞盘、液压绞盘和技术支持。