Prelude
使わない方がいいのはどれ?
Haskell は 25 歳の言語なので、関数的プログラムを組み立てて合成する方法も何度か革命的な変化を受けました。しかし、その結果 Prelude のいろいろな部分が古い流儀の考え方を未だに反映していますが、Haskell の生態系で重要な部分を壊さずにそれらを取り除くことはできないのです。
今のところ、Prelude のどの部分を使うべきでどの部分を使うべきでないのかという情報は、本当に民間伝承にしか存在しません。ほとんどの入門書はこの話題に触れず、単純さのために Prelude を広範囲で利用します。
Prelude についての短い助言はこれです:
map
の代わりにfmap
を使いましょう。- Control.Monad や Data.List にあるバージョンの走査ではなく、Foldable や Traversable を使いましょう。
head
やread
等の部分関数はなるべく使わず、全域関数の変種を使いましょう。- 非同期の例外は使わないようにしましょう。
- ブール値の不透明な関数を使うのは避けましょう。
リスト型の Foldable のインスタンスはしばしば Prelude に歴史的理由で残されている単相のバージョンと衝突します。ですから多くの場合、これらの関数を暗黙のインポートから明示的に排除し、Foldable や Traversable を使わせることが望ましいです。
import Data.List hiding (
all , and , any , concat , concatMap find , foldl ,
foldl' , foldl1 , foldr , foldr1 , mapAccumL ,
mapAccumR , maximum , maximumBy , minimum ,
minimumBy , notElem , or , product , sum )
import Control.Monad hiding (
forM , forM_ , mapM , mapM_ , msum , sequence , sequence_ )
もちろん、Prelude を単に明示的に使用したいだけであることも多く、Prelude を修飾子を付けて (qualified) 名前空間全体を暗黙にインポートすることなく、使いたい時だけ使うこともできます。
import qualified Prelude as P
しかしこうしても、インポートが明示的か暗黙的かに関わらず、いくつかの型クラスのインスタンスと型クラスを持ち込んでしまいます。Prelude にあるものを本当に何も使いたくなければ、(組み込みのクラスのインスタンスを除いて)Prelude 全体を除外するという選択肢もあります。それには -XNoImplicitPrelude
プラグマを使います。
{-# LANGUAGE NoImplicitPrelude #-}
プロジェクト全体が暗黙の Prelude 無しにコンパイルされると仮定すると、Prelude 自体を完全に複製することもできます。同じ機能の大部分を、より現代的な設計原理に合うような方法で提供するパッケージが、いくつか現れています。
部分関数
部分関数は、与えられた入力に対し常に停止し値を生むとは限らない関数である。反対に、全域関数は全ての入力に対し停止し常に定義されている。以前述べたように、Prelude の歴史的な特定の部分は完全に部分関数です。
部分関数と全域関数の違いは、コンパイラが部分関数の実行時の安全性を言語の上で明示された情報だけから推論することができず、安全性の証明自体はユーザーに保証する責任があるということです。ユーザーが無効な入力は生まれないということを保証できる場合には、部分関数は安全に使用できます。しかし、未検査の性質一般に言えることですが、安全か危険かはプログラマの熱心さに依存するものです。これは Haskell の全体的な哲学の真逆を行くものであり、必要でなければ部分関数は使わない方がよいのです。
head :: [a] -> a
read :: Read a => String -> a
(!!) :: [a] -> Int -> a
safe
Prelude に歴史的な部分関数の全域な変種(Text.Read.readMaybe
など)がある場合もありますが、しばしばそうした変種は safe
などのさまざまな多目的ライブラリで見つかります。
ここで提供されている全域のバージョンは 3 つのグループに分類されます。
May
:関数が入力で定義されていなければ Nothing を返します。Def
:関数が入力で定義されていなければデフォルトの値を返します。Note
:関数が入力で定義されていなければ好きなエラーメッセージでerror
を呼び出します。安全ではないですが、ちょっとはデバッグしやすいです!
-- Total
headMay :: [a] -> Maybe a
readMay :: Read a => String -> Maybe a
atMay :: [a] -> Int -> Maybe a
-- Total
headDef :: a -> [a] -> a
readDef :: Read a => a -> String -> a
atDef :: a -> [a] -> Int -> a
-- Partial
headNote :: String -> [a] -> a
readNote :: Read a => String -> String -> a
atNote :: String -> [a] -> Int -> a
ブール値の不透明性
data Bool = True | False
isJust :: Maybe a -> Bool
isJust (Just x) = True
isJust Nothing = False
ブール型の問題は、型レベルでは True と False の間に実質的に何の違いも無いということです。値を受け取って Bool を返す命題は、任意の情報を受け取って破壊してしまうのです。振る舞いについて推論するためには、ブール値の答えを与えた命題の情報源を辿らねばならず、誤った解釈をしてしまう可能性をうんと上げてしまうのです。最悪の場合、関数の仕様が安全か危険か判断するための方法は、述語の名前の文字が情報源を表すと信じることしかないのです!
例えば、各分岐がヌル値の存在下で計算を安全に実行できるかどうかを表す、Bool の値を返す命題をテストすると、得てして予期せぬやりとりが生じます。C や Python のような言語で値がヌルかどうかテストすることは、値がヌルで無いかどうかテストすることと区別が付かない、ということを考えましょう。以下のプログラムのどちらが安全な使用法を表していて、どちらがセグメンテーション違反を起こすでしょうか?
# こっち?
if p(x):
# x を使う
elif not p(x):
# x を使わない
# それともこっち?
if p(x):
# x を使わない
elif not p(x):
# x を使う
詳しく調べようとしても、p がどう定義されているか知っていないと分からないし、コンパイラも2つを区別する術を持ちません。ですから、言語は両者をごちゃ混ぜにしてしまっても助けてくれないのです。無効な状態を表現不可能にする代わりに、無効な状態と有効な状態を区別不可能にしてしまっているのです!
より望ましい方法は、命題を明示的に型(しばしば和型)として目撃していて、そうでなければ型チェックが通らない項について、パターンマッチを行うことです。
case x of
Just a -> use x
Nothing -> don't use x
-- 理想的でない
case p x of
True -> use x
False -> don't use x
-- 理想的でない
if p x
then use x
else don't use x
しかし、公平のために言えば、多くの人気のある言語は和型 (sum type) の概念を全くもって欠いていて(そのせいで多くの悲しみが生まれていると僕は思います)、積型 (product type) だけ持っているので、この種の推論は ML 系言語に慣れていない人には直接の等価である方法がありません。
Haskell では、Prelude が isJust
や fromJust
のような関数を提供していますが、どちらを使ってもこの種の推論が乱れ、バグが起こりやすくなる可能性があり、多くの場合これらの使用は避けるべきです。
FoldableとTraversable
命令型の畑から来た人には、リストに対する反復操作を map や fold や scan を使って考えるように自己を再訓練することは、困難なことです。
Prelude.foldl :: (a -> b -> a) -> a -> [b] -> a
Prelude.foldr :: (a -> b -> b) -> b -> [a] -> b
-- pseudocode
foldr f z [a...] = f a (f b ( ... (f y z) ... ))
foldl f z [a...] = f ... (f (f z a) b) ... y
話を具体的にするために、単純な算術数列を二項演算子 (+)
でまとめることを考えましょう。
-- foldr (+) 1 [2..]
(1 + (2 + (3 + (4 + ...))))
-- foldl (+) 1 [2..]
((((1 + 2) + 3) + 4) + ...)
Foldable と Traversable は、要素型を引数に持つ任意のデータ構造 (リスト、マップ、セット、Maybe、……) の走査と畳み込みに対する、一般性のあるインターフェースです。これら 2 つの型クラスは現代の Haskell ではどこでも使われていて、非常に重要です。
Foldable インスタンスを使えば、ある論理を使って構造を mappend
で潰すモノイドのデータ型に、関数を適用できます。
Traversable インスタンスを使えば、Applicative の環境内で構造を左から右へ歩くデータ型に、関数を適用できます。
class (Functor f, Foldable f) => Traversable f where
traverse :: Applicative g => f (g a) -> g (f a)
class Foldable f where
foldMap :: Monoid m => (a -> m) -> f a -> m
foldMap
関数は恐ろしく一般性があり、直感に反しますが単相のリストの畳み込みの多くは、このたった一つの多相関数を使っても書けます。
foldMap
は、値からモノイドの量への関数、即ち値に対する関手を受け取り、その関手を潰してモノイドにします。例えば、自明な Sum モノイドについて。
λ: foldMap Sum [1..10]
Sum {getSum = 55}
Foldable クラス全体(デフォルトの実装も含めて)は幅広い導出された関数を含んでいます。これらの関数は、foldMap
と Endo
を使って書けます。
newtype Endo a = Endo {appEndo :: a -> a}
instance Monoid (Endo a) where
mempty = Endo id
Endo f `mappend` Endo g = Endo (f . g)
class Foldable t where
fold :: Monoid m => t m -> m
foldMap :: Monoid m => (a -> m) -> t a -> m
foldr :: (a -> b -> b) -> b -> t a -> b
foldr' :: (a -> b -> b) -> b -> t a -> b
foldl :: (b -> a -> b) -> b -> t a -> b
foldl' :: (b -> a -> b) -> b -> t a -> b
foldr1 :: (a -> a -> a) -> t a -> a
foldl1 :: (a -> a -> a) -> t a -> a
例えば:
foldr :: (a -> b -> b) -> b -> t a -> b
foldr f z t = appEndo (foldMap (Endo . f) t) z
リストに対する操作のほとんどは、Foldable と Traversable を組み合わせて、Foldable を実装するすべてのデータ構造に対して動作するより一般的な関数を導出して、一般化することができます。
Data.Foldable.elem :: (Eq a, Foldable t) => a -> t a -> Bool
Data.Foldable.sum :: (Num a, Foldable t) => t a -> a
Data.Foldable.minimum :: (Ord a, Foldable t) => t a -> a
Data.Traversable.mapM :: (Monad m, Traversable t) => (a -> m b) -> t a -> m (t b)
不運にも歴史的な理由により、Foldable によりエクスポートされた名前は、Prelude で定義された名前と衝突することが非常に多いので、Prelude は修飾された状態でインポートするか、単純に無効にしましょう。Foldable の操作は特殊化すれば、すべて Prelude のリスト型に対する操作と同じ振る舞いをします。
import Data.Monoid
import Data.Foldable
import Data.Traversable
import Control.Applicative
import Control.Monad.Identity (runIdentity)
import Prelude hiding (mapM_, foldr)
-- Rose Tree
data Tree a = Node a [Tree a] deriving (Show)
instance Functor Tree where
fmap f (Node x ts) = Node (f x) (fmap (fmap f) ts)
instance Traversable Tree where
traverse f (Node x ts) = Node <$> f x <*> traverse (traverse f) ts
instance Foldable Tree where
foldMap f (Node x ts) = f x `mappend` foldMap (foldMap f) ts
tree :: Tree Integer
tree = Node 1 [Node 1 [], Node 2 [] ,Node 3 []]
example1 :: IO ()
example1 = mapM_ print tree
example2 :: Integer
example2 = foldr (+) 0 tree
example3 :: Maybe (Tree Integer)
example3 = traverse (\x -> if x > 2 then Just x else Nothing) tree
example4 :: Tree Integer
example4 = runIdentity $ traverse (\x -> pure (x+1)) tree
上で定義したインスタンスは、GHC でいくつかの言語拡張を使って、自動的に導出することもできます。自動で得られるインスタンスは、上の手書きのものと同じです。
{-# LANGUAGE DeriveFunctor #-}
{-# LANGUAGE DeriveFoldable #-}
{-# LANGUAGE DeriveTraversable #-}
data Tree a = Node a [Tree a]
deriving (Show, Functor, Foldable, Traversable)
参照:
余再帰
unfoldr :: (b -> Maybe (a, b)) -> b -> [a]
再帰関数はデータを消費し最終的に停止しますが、余再帰関数はデータを生成し、余停止します。有界の時間で結果の値の多くを評価できるとき、余再帰関数は生産的であるといいます。
import Data.List
f :: Int -> Maybe (Int, Int)
f 0 = Nothing
f x = Just (x, x-1)
rev :: [Int]
rev = unfoldr f 10
fibs :: [Int]
fibs = unfoldr (\(a,b) -> Just (a,(b,a+b))) (0,1)
split
split パッケージは、リストや文字列を分けるための、欠落していたさまざまな関数を提供しています。
import Data.List.Split
example1 :: [String]
example1 = splitOn "." "foo.bar.baz"
-- ["foo","bar","baz"]
example2 :: [String]
example2 = chunksOf 10 "To be or not to be that is the question."
-- ["To be or n","ot to be t","hat is the"," question."]
monad-loops
monad-loops パッケージはモナディックな環境での制御の論理を得るための、欠落していたさまざまな関数を提供しています。
whileM :: Monad m => m Bool -> m a -> m [a]
untilM :: Monad m => m a -> m Bool -> m [a]
iterateUntilM :: Monad m => (a -> Bool) -> (a -> m a) -> a -> m a
whileJust :: Monad m => m (Maybe a) -> (a -> m b) -> m [b]