函数式编程——函数式编程术语
译者注:本项目译自 functional-programing-jargon,专业术语居多,如有错误,可以提 pr 更正。除了术语翻译,针对每项术语,也有代码示例,位于 /demos 目录下。另外,这里也有几份不错的文章和仓库。 + 函数式编程入门教程 + mostly-adequate-guide (10749 stars) + mostly-adequate-guide-chinese (602 stars) + fantasy-land
函数式编程有许多优势,由此越来越受欢迎。然而每个编程范式 (paradigm) 都有自己唯一的术语,函数式编程也不例外。我们提供一张术语表,希望使你学习函数式编程变得容易些。
示例均为 javascript (ES2015)。为什么使用JavaScript?
尚在 WIP 阶段,欢迎 pr。
如果适用,本篇文档使用定义在 Fantasy Land spec 中的术语。
目录
- Arity
- 高阶函数 (Higher-Order Function / HOF)
- 闭包 (Closure)
- 偏函数应用 (Partial Application)
- 柯里化 (Currying)
- 自动柯里化 (Auto Currying)
- 函数组合 (Function Composition)
- Continuation (后续)
- 纯函数 (Purity)
- 副作用 (Side effects)
- 幂等 (Idempotent)
- Point-Free 风格 (Point-Free Style)
- 断定 (Predicate)
- 契约 (Contracts)
- 范畴 (Category)
- 值 (Value)
- 常量 (Constant)
- 函子 (Functor)
- 抬升 (Lift)
- 引用透明性 (Referential Transparency)
- 等式推理 (Equational Reasoning)
- Lambda
- Lambda演算 (Lambda Calculus)
- 惰性求值 (Lazy evaluation)
- 幺半群 (Monoid)
- 单子 (Monad)
- 余单子 (Comonad)
- 应用函子 (Applicative Functor)
- 态射 (Morphism)
- Setoid
- 半群 (Semigroup)
- 可折叠性 (Foldable)
- 透镜 (Lens)
- 类型签名 (Type Signatures)
- 代数数据类型 (Algebraic data type)
- 可选类型 (Option)
- Function
- 偏函数 (Partial function)
- 在 js 中的函数式编程库
Arity
函数参数的个数。来自于单词 unary(一元), binary(二元), ternary(三元)
等等。这个单词是由 -ary 与 -ity
两个后缀拼接而成。例如,加法函数有两个参数,因此它被定义为二元函数(binary function
),或者说它的
arity
是2。它也被那些更喜欢希腊词根而非拉丁词根的人称为
dyadic
。同样地,带有可变数量的参数的函数被称为
variadic
,而二元函数只能且必须带两个参数,尽管有柯里化(currying)和偏函数应用(partial
application)的存在(见下文)。
1 | const sum = (a, b) => a + b |
高阶函数 (Higher-Order Function / HOF)
以函数为参数或/和返回值的函数。
1 | const filter = (predicate, xs) => xs.filter(predicate) |
闭包 (Closure)
闭包是访问在其作用域外的变量的一种方式。正式地说,闭包是一种用于实现词法作用域命名绑定的技术。它是存储一个函数和它的环境的一种方法。
闭包是一个作用域,它会捕获函数的局部变量,因此即使执行过程已经移出了定义它的那个代码块,也可以访问它们。也就是说,它们允许在声明变量的代码块已经执行完成之后,还是可以引用这个作用域。
1 | const addTo = x => y => x + y; |
函数addTo()
返回了一个函数(在内部调用了add()
),我们将它保存在了一个叫做addToFive
的变量中,并且柯里化地用一个参数5来调用它。
理想情况下,当函数addTo
执行完成后,它的作用域,包括本地变量add(即+),x,y,都应该无法访问了。但是,addToFive()
的调用返回了8。这说明,addTo
函数的状态被保存了,即使在代码块已经完成执行之后。否则,就不会知道addTo
曾经被addTo(5)
这样调用过,且x的值被设为了5。
词法作用域(lexical scoping)是它能找到x和add这两个已经完成执行的父级私有变量的原因。这个值就称为闭包。
栈和函数的词法作用域被以父函数的引用的形式存储。这可以防止闭包和底层的变量被垃圾回收(因为至少有一个对它的有效引用)。
Lambda Vs 闭包:Lambda本质上是一个内联定义的函数,而不是声明函数的标准方法。Lambda经常可以作为对象被传递。
闭包是通过引用其主体外部的字段来将其周围的状态包裹进来的函数。被包裹的状态在闭包调用期间保持不变。
偏函数应用 (Partial Application)
"部分地"应用一个函数,即预设原始函数的部分参数来创建一个新的函数。
1 | // 创建偏函数,固定一些参数 |
也可以使用 Function.prototype.bind
实现偏函数。
1 | const add1More = add3.bind(null, 2, 3) // (c) => 2 + 3 + c |
偏函数应用通过对复杂的函数填充一部分数据来构成一个简单的函数。柯里化就是自动实现的偏函数。
柯里化 (Currying)
将一个多元函数转变为一元函数的过程。 每当函数被调用时,它仅仅接收一个参数并且返回带有一个参数的函数,直到传递完所有的参数。
1 | const sum = (a, b) => a + b |
自动柯里化 (Auto Currying)
将一个包含多个参数的函数转换成另一个函数,这个函数如果被给到的参数少于正确的数量,就会返回一个接受剩余参数的函数。
lodash & Ramda 有一个curry
函数可以做到这一点。
1 | const add = (x, y) => x + y |
进一步阅读
函数组合 (Function Composition)
把两个函数放在一起形成第三个函数的行为,一个函数的输入为另一个函数的输出。
1 | const compose = (f, g) => (a) => f(g(a)) // 定义 |
Continuation (后续)
在一个程序执行的任意时刻,尚未执行的代码称为 Continuation。
1 | const printAsString = (num) => console.log(`Given ${num}`) |
Continuation 在异步编程中很常见,比如当程序需要接收到数据才能够继续执行。请求的响应通常作为代码的剩余执行部分,一旦接收到数据,对数据的处理被作为 Continuation。
1 | const continueProgramWith = (data) => { |
纯函数 (Purity)
输出仅由输入决定,且不产生副作用。
1 | const greet = (name) => `hello, ${name}` |
以下代码不是纯函数:
1 | window.name = 'Brianne' |
以上示例中,函数输出基于在函数外部存储的数据。
1 | let greeting |
以上示例中,函数修改了外部状态。
副作用 (Side effects)
如果一个函数或者表达式除了返回一个值之外,还与外部可变状态进行了交互(读取或写入),则它是有副作用的。
1 | const differentEveryTime = new Date() |
1 | console.log('IO就是一种副作用!') |
幂等 (Idempotent)
如果一个函数执行多次皆返回相同的结果,则它是幂等的。
1 | f(f(x)) ≍ f(x) |
1 | Math.abs(Math.abs(10)) |
1 | sort(sort(sort([2, 1]))) |
Point-Free 风格 (Point-Free Style)
定义函数时,不显式地指出函数所带参数。这种风格通常需要柯里化或者高阶函数。也叫 Tacit programming。
1 | // 已知: |
incrementAll
识别并且使用了 numbers
参数,因此它不是 Point-Free 风格的。 incrementAll2
仅连接函数与值,并不提及它所使用的参数,因为它是 Point-Free 风格的。
Point-Free 风格的函数就像平常的赋值,不使用 function
或者 =>
。
断定 (Predicate)
根据输入返回 true 或 false。通常用在 array filter 的回调函数中。
1 | const predicate = (a) => a > 2 |
契约 (Contracts)
契约规定了函数或表达式在运行时的行为的职责和保障。它表现为一组规则,这些规则是对函数或表达式的输入和输出的期望。当违反契约时,将抛出一个错误。
1 | // 定义的contract: int -> boolean |
范畴 (Category)
在范畴论中,范畴是指对象集合及它们之间的态射 (morphism)。在编程中,数据类型作为对象,函数作为态射。
一个有效的范畴遵从以下三个原则:
- 必有一个同一态射(identity morphism)将一个对象映射到它自身。即当
a
是范畴里的一个对象时,必有一个函数使a -> a
。 - 态射必是可组合的。
a
,b
,c
是范畴里的对象,f
是态射a -> b
,g
是b -> c
态射。g(f(x))
一定与(g • f)(x)
是等价的。 - 组合满足结合律。
f • (g • h)
与(f • g) • h
是等价的。
由于这些准则是在非常抽象的层面控制着组合方式,因此范畴论对于发现组合的新方法来说是伟大的。
进一步阅读
值 (Value)
任何可以赋给变量的东西叫做值。
1 | 5 |
常量 (Constant)
一旦被定义之后就不可以被重新赋值。
1 | const five = 5 |
常量是引用透明的,也就是说,它们可以被它们所代表的值替代而不影响结果。
对于以上两个常量,以下语句总会返回 true。
1 | john.age + five === ({name: 'John', age: 30}).age + (5) |
函子 (Functor)
函子是一个实现了 map
函数的对象。map
函数会遍历对象中的每个值并生成一个新的对象,遵守两个准则:
一致性 (Preserves identity)
1 | object.map(x => x) ≍ object |
组合性 (Composable)
1 | object.map(compose(f, g)) ≍ object.map(g).map(f) // f, g 为任意函数 |
(f
, g
是任意的函数)
在 javascript 中一个常见的函子是 Array, 因为它遵守因子的两个准则。
1 | const f = x => x + 1 |
指向函子 (Pointed Functor)
一个对象,拥有一个of
函数,可以将一个任何值放入它自身。
ES2015 添加了 Array.of
,使 Array 成为了 Pointed
Functor。
1 | Array.of(1) |
抬升 (Lift)
抬升是指将一个值放进一个对象(如函子)中。如果你将一个函数抬升到一个应用函子中,那么就可以将它作用于该函子中的值。
1 | const liftA2 = (f) => (a, b) => a.map(f).ap(b) // 注意这里是 ap 而不是 map. |
抬升并应用一个单参数的函数的作用等同于 map
。
1 | const increment = (x) => x + 1 |
引用透明性 (Referential Transparency)
如果一个表达式能够被它的值替代而不改变程序的行为,则它是引用透明的。
例如我们有 greet 函数:
1 | const greet = () => 'hello, world.' |
任何对 greet()
的调用都可以被替换为
Hello World!
, 因此 greet 是引用透明的。
等式推理 (Equational Reasoning)
当一个应用程序由表达式组成并且没有副作用时,我们可以从这些组成部分中得知系统的真相。
Lambda
一种可以被视作一个值的匿名函数。
1 | ;(function (a) { |
Lambda 通常作为参数被传递给高阶函数。
1 | [1, 2].map((a) => a + 1) |
可以把 Lambda 赋值给一个变量。
1 | const add1 = (a) => a + 1 |
Lambda演算 (Lambda Calculus)
数学的一个分支,使用函数创造 通用计算模型
惰性求值 (Lazy evaluation)
惰性求值是一种按需调用的求值机制,它将表达式的求值延迟到需要它的值为止,在函数式语言中,允许类似无限列表这样的结构存在,而这在非常重视命令顺序的命令式语言中通常是不可用的。
1 | const rand = function* () { |
幺半群 (Monoid)
一个对象,它拥有一个函数,这个函数用来与另一个相同类型的对象"结合"。对象的类型(半群)必须具有一个"identity"值。
数值加法是一个简单的幺半群:
1 | 1 + 1 // 2 |
以上示例中,数是对象而 +
是函数。
当任何一个值与"identity"值结合时,结果一定是原始的值。"identity"也是可换位的(即排列次序不影响结果)。
加法的特征值是 0。
1 | 1 + 0 // 1 |
操作的组合不会影响结果(必须满足结合律):
1 | 1 + (2 + 3) === (1 + 2) + 3 // true |
数组的结合也是幺半群:
1 | ;[1, 2].concat([3, 4]) // [1, 2, 3, 4] |
identity
值为空数组
1 | ;[1, 2].concat([]) |
减法作为一个反例,不形成幺半群,因为不存在可以换位的"identity"值。
1 | 0 - 4 === 4 - 0 // false |
单子 (Monad)
拥有 of
和 chain
函数的对象即为单子。chain
很像 map
,
不同的是它可以展平嵌套数据。
1 | Array.prototype.chain = function (f) { |
在有些函数式语言中,of
也称为
return
,chain
也称为 flatmap
与
bind
。
余单子 (Comonad)
拥有 extract
与 extend
函数的对象。
1 | const CoIdentity = (v) => ({ |
Extract 将值从余单子中取出。
1 | CoIdentity(1).extract() // 1 |
Extends 在余单子上运行一个函数。这个函数会返回和余单子相同的类型。
1 | CoIdentity(1).extend(x => x.extract() + 1) // CoIdentity(2) |
应用函子 (Applicative Functor)
一个拥有 ap
函数的对象称为应用函子。ap
将对象中的函数应用于另一个同样类型的对象中的值。
1 | // 实现 |
如果你有两个对象,并需要对他们的元素执行一个二元函数,这将会很有用。
1 | // 你想要组合的两个数组 |
由此得到了一个函数数组,并且可以调用 ap
函数得到结果。
1 | partiallyAppliedAdds.ap(arg2) // [5, 6, 7, 8] |
态射 (Morphism)
一个变形函数。
Endomorphism (自同态)
输入输出是相同类型的函数。
1 | // uppercase :: String -> String |
Isomorphism (同构)
两个不用类型的对象之间的变换,保持结构并且不丢失数据。
例如,一个二维坐标既可以表示为数组
[2, 3]
,也可以表示为对象 {x: 2, y: 3}
。
1 | // 提供函数在两种类型间互相转换 |
Homomorphism (同态)
同态只是一个保持结构的映射,实际上,函子只是范畴之间的同态,因为它在映射下保持了原范畴的结构。
1 | A.of(f).ap(A.of(x)) == A.of(f(x)) |
Catamorphism
一个 reduceRight
函数,它应用于累加器(accumulator)和数组中的每个值(从右到左),来将其缩减为一个单一的值。
Anamorphism
一个 unfold
函数。unfold
是
fold
(ruduce
)的反面。它从一个值生成一个列表。
1 | const unfold = (f, seed) => { |
1 | const countDown = n => unfold((n) => { |
Hylomorphism
Anamorphism 和 catamorphism 的结合。
Paramorphism
一类类似于 reduceRight
的函数,不过还是有区别的:
在Paramorphism中,reducer的参数是当前的值、所有先前的值的缩减(reduction,即reduce的结果)、以及形成该缩减的值的列表。
1 | // 包含 undefined 对于列表来说显然是不安全的, |
上面的例子中的
reducer([x, ... xs]
)的第三个参数有点像一个"如何达到你当前的
acc 值"的历史记录。
Apomorphism
paramorphism 的反面。就像 anamorphism 是 catamorphism 的反面一样。对于 paramorphism,我们结合了对累加器的访问和已经累加的东西,而apomorphism让我们可以 unfold(展开)并且具有提早return的可能性。
Setoid
拥有 equals
函数的对象。equals
可以用来和其它相同类型的对象比较。
1 | Array.prototype.equals = function (arr) { |
半群 (Semigroup)
一个拥有 concat
函数的对象。concat
可以连接相同类型的两个对象。
1 | ;[1].concat([2]) // [1, 2] |
可折叠性 (Foldable)
一个拥有 reduce
函数的对象具有可折叠性。reduce
可以把一种类型的对象转化为另一种类型。
1 | const sum = (list) => list.reduce((acc, val) => acc + val, 0) |
透镜 (Lens)
Lens是一种结构(通常是一个对象或者函数),他为其他数据结构对 getter 和非可变的 setter 进行配对。
1 | // 使用 [Ramda's lens](http://ramdajs.com/docs/#lens) |
为给定的数据结构设置 get
和 set
可以实现一些关键特性。
1 | const person = {name: 'Gertrude Blanch'} |
lens 也是可以组合的。这让我们可以对深度嵌套的数据进行简单的不可变更新。
1 | // 这个 lens 关注一个非空数组中的第一个元素 |
其他实现:
partial.lenses - "好吃"的语法糖和很多强大功能
nanoscope - 流畅接口
类型签名 (Type Signatures)
通常 js 中的函数会在注释中指出参数与返回值的类型。
在整个社区内存在很大的差异,但通常遵循以下模式:
1 | // functionName :: firstArgType -> secondArgType -> returnType |
如果函数接受其他函数作为参数,那么这个函数需要用括号括起来。
1 | // call :: (a -> b) -> a -> b |
字符 a
, b
, c
, d
表明参数可以是任意类型。以下版本的 map
的函数类型的参数
f
,把一种类型 a
的数组转化为另一种类型
b
的数组。
1 | // map :: (a -> b) -> [a] -> [b] |
进一步阅读:
- Ramda's type signatures
- What is Hindley-Milner? on Stack Overflow
代数数据类型 (Algebraic data type)
一种由其他类型组合而成的复合类型。两种常见的代数类型是sum和product。
和类型 (Sum type)
和类型是将两种类型组合成另一种类型。之所以称为和,是因为结果类型的可能的值的数目是两种输入类型的值的数目的和。
js 中没有这种类型,但是我们可以用 set 来假装:
1 | // 想象这些不是 set,而是仅包含这些值的某种类型。 |
和类型有时也称作联合类型(union type)、区分联合(discriminated union)或标记联合(tagged unions)。
JS中有一些库可以帮助定义和使用联合类型。
流(flow)包括联合类型,而TypeScript具有提供相同能力的枚举(enum)。
Product type
用一种你可能更熟悉的方式把数据类型联合起来:
1 | // point :: (Number, Number) -> {x: Number, y: Number} |
之所以称之为积,是因为数据结构的总的可能值是不同值的乘积。许多语言都有 tuple 类型,这是积类型的最简单形式。
另见 Set theory
可选类型 (Option)
Option 是一种联合类型,它有两种情况,Some
或者
None
。
Option对于一些可能不会返回值的组合函数非常有用。
1 | // 简单的定义 |
使用 chain
可以序列化返回 Option
的函数。
1 | // getItem :: Cart -> Option CartItem |
在其它的一些地方,Option
也称为
Maybe
,Some
也称为
Just
,None
也称为 Nothing
。
Function
一个函数 f :: A => B
是一个表达式,通常称为 arrow
或者 lambda 表达式——只能有一个(这点是不可变的)的
A
类型参数和一个 B
类型返回值。该返回值完全取决于参数,使函数独立于上下文,或者说引用透明。这里暗示的是一个函数不能产生任何隐藏的副作用——根据定义,函数总是纯的。这些属性使函数易于使用:它们是完全确定的,因此也是可以预测的。函数可以将代码作为数据进行处理,对行为进行抽象:
1 | // times2 :: Number -> Number |
偏函数 (Partial function)
偏函数是没有为全部参数定义的函数——它可能返回意料之外的结果或者永远不会终止。偏函数增加了认知开销,它们更难推理,并可能导致运行时错误。一些例子:
1 | // 例1: 列表的和 |
处理偏函数
偏函数是危险的,它们需要被非常谨慎地对待。你可能会得到意料之外的(错误的)结果或遇到运行时错误。有时偏函数可能根本不会返回。意识到并相应地处理所有这些边缘情况可能会变得非常乏味。幸运的是,部分函数可以转换为常规函数。我们可以提供默认值或使用
guard 来处理偏函数未定义的输入。利用 option
类型,我们可以在可能会出现意外行为的地方使用 yield
Some(value)
或 None
:
1 | // 例1: 列表的和 |
将偏函数改成全函数可以防止此类运行时错误。总是返回一个"值"也会使得代码更容易维护和推理。