  • 整數
  • 標識符([a-zA-Z]+
  • +*和括號算術表達式
  • .(例如 foo.bar.buz
  • 元組
  • 結構的接入(例如(1, foo, bar.buz))(爲了消除歧義,一元組被寫爲(x,)
  • 功能的應用程序(例如foo(1, bar, buz())
  • 功能是一流的,使他們也可以從其它功能直接返回和應用(如foo()()是合法的,因爲foo()可能會返回一個函數)


(1+2*3, f(4,5,6)(bar) + qux.quux()().quuux) 


((1+(2*3)), (((f(4,5,6))(bar)) + ((((qux.quux)())()).quuux))) 


的第一個問題是明顯的是,直覺的表達式文法(expr -> identifier | number | expr * expr | expr + expr | (expr)是左遞歸的。但是,我可以使用的pChainl組合子(見parseExpr在下面的示例)解決這個問題。

剩下的問題(因此這個問題)是功能應用與從其他功能(f()())返回的函數。 combinators以及我猜)


{-# LANGUAGE FlexibleContexts #-} 
{-# LANGUAGE RankNTypes #-} 

module TestExprGrammar 
    ) where 

import Data.Foldable (asum) 
import Data.List (intercalate) 
import Text.ParserCombinators.UU 
import Text.ParserCombinators.UU.Utils 
import Text.ParserCombinators.UU.BasicInstances 

data Node = 
    NumberLiteral Integer 
    | Identifier String 
    | Tuple [Node] 
    | MemberAccess Node Node 
    | FunctionCall Node [Node] 
    | BinaryOperation String Node Node 

parseFunctionCall :: Parser Node 
parseFunctionCall = 
    FunctionCall <$> 
     parseIdentifier {- `parseExpr' would be correct but left-recursive -} 
     <*> parseParenthesisedNodeList 0 

operators :: [[(Char, Node -> Node -> Node)]] 
operators = [ [('+', BinaryOperation "+")] 
      , [('*' , BinaryOperation "*")] 
      , [('.', MemberAccess)] 

samePrio :: [(Char, Node -> Node -> Node)] -> Parser (Node -> Node -> Node) 
samePrio ops = asum [op <$ pSym c <* pSpaces | (c, op) <- ops] 

parseExpr :: Parser Node 
parseExpr = 
    foldr pChainl 
      <|> parseNumber 
      <|> parseTuple 
      <|> parseFunctionCall 
      <|> pParens parseExpr 
      (map samePrio operators) 

parseNodeList :: Int -> Parser [Node] 
parseNodeList n = 
    case n of 
     _ | n < 0 -> parseNodeList 0 
     0 -> pListSep (pSymbol ",") parseExpr 
     n -> (:) <$> 
      <* pSymbol "," 
      <*> parseNodeList (n-1) 

parseParenthesisedNodeList :: Int -> Parser [Node] 
parseParenthesisedNodeList n = pParens (parseNodeList n) 

parseIdentifier :: Parser Node 
parseIdentifier = Identifier <$> pSome pLetter <* pSpaces 

parseNumber :: Parser Node 
parseNumber = NumberLiteral <$> pNatural 

parseTuple :: Parser Node 
parseTuple = 
    Tuple <$> parseParenthesisedNodeList 1 
    <|> Tuple [] <$ pSymbol "()" 

instance Show Node where 
    show n = 
     let showNodeList ns = intercalate ", " (map show ns) 
      showParenthesisedNodeList ns = "(" ++ showNodeList ns ++ ")" 
     in case n of 
       Identifier i -> i 
       Tuple ns -> showParenthesisedNodeList ns 
       NumberLiteral n -> show n 
       FunctionCall f args -> show f ++ showParenthesisedNodeList args 
       MemberAccess f g -> show f ++ "." ++ show g 
       BinaryOperation op l r -> "(" ++ show l ++ op ++ show r ++ ")" 



the list-like combinatorsuu-parsinglib尋找簡單(我更熟悉parsec),我想你可以通過摺疊pSome組合子的結果,解決這個問題:

parseFunctionCall :: Parser Node 
parseFunctionCall = 
    foldl' FunctionCall <$> 
     parseIdentifier {- `parseExpr' would be correct but left-recursive -} 
     <*> pSome (parseParenthesisedNodeList 0) 

這也相當於Alternativesome combinator,它確實應用於您提到的其他解析庫。


哦,是的,的確,這非常優雅,簡單,並且工作正常! – 2014-10-05 20:49:26



E -> T E' 
E' -> + TE' | eps 
T -> F T' 
T' -> * FT' | eps 
F -> NUMBER | ID | (E) 


E -> T E' 
E' -> + TE' | eps 
T -> AT' 
T' -> * A T' | eps 
A -> F A' 
A' -> (E) A' | eps 
F -> NUMBER | ID | (E) 

是的,這是比左遞歸一個毛茸茸的前瞻性語法和更大。這是自頂向下預測分析的價格。如果你想讓簡單的語法使用自下而上的解析器生成器la yacc。


謝謝@Gene!我其實並沒有在我的問題中提到這一點,但我試圖解決左邊的保理問題,因爲它不是很優雅,是很多工作,並且使得AST更難。因此,我非常高興能夠解決運營商問題(而不是功能應用)的'pChainl'組合器。但是,也許實際上並沒有一個簡單而優雅的解決方案,我必須將整個語法的因素留下: - \。我可能也會切換到像yacc那樣的'happy'解析器生成器。 – 2014-10-05 00:46:36
