私は2つのアプローチを考えることができます:
libclang
レクサーの使用
このSOの回答に表示されるコードは私にとってはうまくいきます。libclang
トークナイザーを使用してメソッド宣言を分割し、メソッドの括弧の外側にキーワードを記録します。
コードの AST にはアクセスしません。私が知る限り、パーサーはまったく関与していません。調査するコードが適切な C++ であると確信している場合、このアプローチは安全だと思います。
短所: このソリューションは、前処理ディレクティブを考慮していないように見えるため、コードを最初に処理する必要があります (たとえば、 を介して渡しますcpp
)。
コード例 (解析するファイルは、プログラムの最初の引数である必要があります。例: ./a.out bla.cpp
):
#include "clang-c/Index.h"
#include <string>
#include <set>
#include <iostream>
std::string GetClangString(CXString str)
{
const char* tmp = clang_getCString(str);
if (tmp == NULL) {
return "";
} else {
std::string translated = std::string(tmp);
clang_disposeString(str);
return translated;
}
}
void GetMethodQualifiers(CXTranslationUnit translationUnit,
std::set<std::string>& qualifiers,
CXCursor cursor) {
qualifiers.clear();
CXSourceRange range = clang_getCursorExtent(cursor);
CXToken* tokens;
unsigned int numTokens;
clang_tokenize(translationUnit, range, &tokens, &numTokens);
bool insideBrackets = false;
for (unsigned int i = 0; i < numTokens; i++) {
std::string token = GetClangString(clang_getTokenSpelling(translationUnit, tokens[i]));
if (token == "(") {
insideBrackets = true;
} else if (token == "{" || token == ";") {
break;
} else if (token == ")") {
insideBrackets = false;
} else if (clang_getTokenKind(tokens[i]) == CXToken_Keyword &&
!insideBrackets) {
qualifiers.insert(token);
}
}
clang_disposeTokens(translationUnit, tokens, numTokens);
}
int main(int argc, char *argv[]) {
CXIndex Index = clang_createIndex(0, 0);
CXTranslationUnit TU = clang_parseTranslationUnit(Index, 0,
argv, argc, 0, 0, CXTranslationUnit_None);
// Set the file you're interested in, and the code location:
CXFile file = clang_getFile(TU, argv[1]);
int line = 5;
int column = 6;
CXSourceLocation location = clang_getLocation(TU, file, line, column);
CXCursor cursor = clang_getCursor(TU, location);
std::set<std::string> qualifiers;
GetMethodQualifiers(TU, qualifiers, cursor);
for (std::set<std::string>::const_iterator i = qualifiers.begin(); i != qualifiers.end(); ++i) {
std::cout << *i << std::endl;
}
clang_disposeTranslationUnit(TU);
clang_disposeIndex(Index);
return 0;
}
libclang
の統一シンボル解決 (USR) の使用
このアプローチでは、パーサー自体を使用し、AST から修飾子情報を抽出します。
利点: 少なくとも単純なケースでは、プリプロセッサ ディレクティブを含むコードで機能するようです。
短所: 私のソリューションは文書化されていない USR を解析し、将来変更される可能性があります。それでも、それを防ぐために単体テストを書くのは簡単です。
を見てください$(CLANG_SRC)/tools/libclang/CIndexUSRs.cpp
。USR を生成するコードが含まれているため、USR 文字列を解析するために必要な情報が含まれています。具体的には、523 ~ 529 行目 (www.llvm.org からダウンロードした LLVM 3.1 のソース内) の修飾子部分です。
次の関数をどこかに追加します。
void parseUsrString(const std::string& usrString, bool* isVolatile, bool* isConst, bool *isRestrict) {
size_t bangLocation = usrString.find("#");
if (bangLocation == std::string::npos || bangLocation == usrString.length() - 1) {
*isVolatile = *isConst = *isRestrict = false;
return;
}
bangLocation++;
int x = usrString[bangLocation];
*isConst = x & 0x1;
*isVolatile = x & 0x4;
*isRestrict = x & 0x2;
}
でmain()
、
CXString usr = clang_getCursorUSR(cursor);
const char *usr_string = clang_getCString(usr);
std::cout << usr_string << "\n";
bool isVolatile, isConst, isRestrict;
parseUsrString(usr_string, &isVolatile, &isConst, &isRestrict);
printf("restrict, volatile, const: %d %d %d\n", isRestrict, isVolatile, isConst);
clang_disposeString(usr);
Foo::qux()
から走っている
#define BLA const
class Foo {
public:
void bar() const;
void baz() volatile;
void qux() BLA volatile;
};
の期待される結果を生成します
c:@C@Foo@F@qux#5
restrict, volatile, const: 0 1 1
警告:のソースは、私のコードは ではなくでlibclang
あるべきだと示唆していることに気付いたかもしれません。私の実装(OS X)でそれらが置き換えられた可能性があります。isVolatile = x & 0x2
0x4