lexical-analysis

11熱度

3回答

我已經寫了一個生成器來實現這個技巧，但我想知道實現偏離規則的最佳方法。不久：Off-side rule意味着在這種情況下，縮進被認爲是一個句法元素。這裏是僞越位規則進行斷詞，在可用的形式捕捉壓痕，我不想用語言來限制答案： token NEWLINE matches r"\n\ *" increase line count pick up and store the

1熱度

2回答

在flex/lex中實現詞邊界狀態（解析器生成器）

我希望能夠預測模式匹配是否出現在單詞字符之後或非單詞字符之後。換句話說，我想在flex/lex不支持的模式開始處模擬\ b分詞正則表達式字符。這是我下面的嘗試（不工作如期望的那樣）： %{ #include <stdio.h> %} %x inword %x nonword %% [a-zA-Z] { BEGIN inword; yymore(); } [^a-zA-Z] {

14熱度

7回答

在Python中高效地匹配多個正則表達式

當你有正則表達式時，詞法分析器很容易編寫。今天我想用Python語言編寫一個簡單的一般分析，並與上前： import re import sys class Token(object): """ A simple Token structure. Contains the token type, value and position. """ def

7熱度

3回答

FLEX：有沒有辦法一次返回多個標記

在flex中，我想爲正則表達式的一個匹配返回多個標記。有沒有辦法做到這一點？

11熱度

4回答

C＃/。NET Lexer生成器

我正在尋找一個像樣的詞法掃描生成器的C＃/。NET - 東西，支持Unicode字符類別，並生成有點可讀&有效的代碼。任何人都知道嗎？編輯：我需要的Unicode類別，不只是Unicode字符支持。目前在Lu（Letter，Uppercase）類別中僅有1421個字符，我需要非常明確地匹配許多不同的類別，而不是手寫必要的字符集。而且，實際的代碼是一個必須 - 這排除了的東西產生（即GOLD）的

1熱度

2回答

FLEX（詞法分析器）正則表達式 - 重用定義

我有這個工作定義： IDENTIFIER [a-zA-Z][a-zA-Z0-9]* 我不想不斷重複的[A-ZA-Z]和[0-9]，所以我做了兩個新的定義 DIGIT [0-9] VALID [a-zA-Z] 我怎麼能改寫的識別規則採用數字和有效定義？我不知道該怎麼做「老二」的比賽，我在這裏堅持： IDENTIFIER {VALID}[{VALID}{DIGIT}]* // This s

14熱度

3回答

Erlang分析器/分析器？

Erlang是否有很好的代碼分析器/分析器？我需要一些可以爲我的代碼構建調用圖的東西。