を使用して、 nm のデマングルされたシンボル出力から (完全な) クラス名を抽出しようとしていboost::regex
ます。このサンプルプログラム
#include <vector>
namespace Ns1
{
namespace Ns2
{
template<typename T, class Cont>
class A
{
public:
A() {}
~A() {}
void foo(const Cont& c) {}
void bar(const A<T,Cont>& x) {}
private:
Cont cont;
};
}
}
int main()
{
Ns1::Ns2::A<int,std::vector<int> > a;
Ns1::Ns2::A<int,std::vector<int> > b;
std::vector<int> v;
a.foo(v);
a.bar(b);
}
クラスAの次のシンボルを生成します
Ns1::Ns2::A<int, std::vector<int, std::allocator<int> > >::A()
Ns1::Ns2::A<int, std::vector<int, std::allocator<int> > >::bar(Ns1::Ns2::A<int, std::vector<int, std::allocator<int> > > const&)
Ns1::Ns2::A<int, std::vector<int, std::allocator<int> > >::foo(std::vector<int, std::allocator<int> > const&)
Ns1::Ns2::A<int, std::vector<int, std::allocator<int> > >::~A()
できれば単一の正規表現パターンを使用してクラス (インスタンス) 名を抽出したいのですが、ペアNs1::Ns2::A<int, std::vector<int, std::allocator<int> > >
内で再帰的に発生するクラス指定子を解析するのに問題があります。<>
正規表現パターンを使用してこれを行う方法を知っている人はいますか (でサポートされていboost::regex
ます)?
私の解決策( David Hammenの回答に基づいているため、受け入れられます):
クラスと名前空間のシンボルを抽出するために (単一の) 正規表現は使用しません。シンボル文字列の末尾から括弧文字のペア (<>
またはなど)を取り除く単純な関数を作成しました。()
std::string stripBracketPair(char openingBracket,char closingBracket,const std::string& symbol, std::string& strippedPart)
{
std::string result = symbol;
if(!result.empty() &&
result[result.length() -1] == closingBracket)
{
size_t openPos = result.find_first_of(openingBracket);
if(openPos != std::string::npos)
{
strippedPart = result.substr(openPos);
result = result.substr(0,openPos);
}
}
return result;
}
これは、シンボルから名前空間/クラスを抽出する他の 2 つのメソッドで使用されます。
std::string extractNamespace(const std::string& symbol)
{
std::string ns;
std::string strippedPart;
std::string cls = extractClass(symbol);
if(!cls.empty())
{
cls = stripBracketPair('<','>',cls,strippedPart);
std::vector<std::string> classPathParts;
boost::split(classPathParts,cls,boost::is_any_of("::"),boost::token_compress_on);
ns = buildNamespaceFromSymbolPath(classPathParts);
}
else
{
// Assume this symbol is a namespace global function/variable
std::string globalSymbolName = stripBracketPair('(',')',symbol,strippedPart);
globalSymbolName = stripBracketPair('<','>',globalSymbolName,strippedPart);
std::vector<std::string> symbolPathParts;
boost::split(symbolPathParts,globalSymbolName,boost::is_any_of("::"),boost::token_compress_on);
ns = buildNamespaceFromSymbolPath(symbolPathParts);
std::vector<std::string> wsSplitted;
boost::split(wsSplitted,ns,boost::is_any_of(" \t"),boost::token_compress_on);
if(wsSplitted.size() > 1)
{
ns = wsSplitted[wsSplitted.size() - 1];
}
}
if(isClass(ns))
{
ns = "";
}
return ns;
}
std::string extractClass(const std::string& symbol)
{
std::string cls;
std::string strippedPart;
std::string fullSymbol = symbol;
boost::trim(fullSymbol);
fullSymbol = stripBracketPair('(',')',symbol,strippedPart);
fullSymbol = stripBracketPair('<','>',fullSymbol,strippedPart);
size_t pos = fullSymbol.find_last_of(':');
if(pos != std::string::npos)
{
--pos;
cls = fullSymbol.substr(0,pos);
std::string untemplatedClassName = stripBracketPair('<','>',cls,strippedPart);
if(untemplatedClassName.find('<') == std::string::npos &&
untemplatedClassName.find(' ') != std::string::npos)
{
cls = "";
}
}
if(!cls.empty() && !isClass(cls))
{
cls = "";
}
return cls;
}
このbuildNamespaceFromSymbolPath()
メソッドは、有効な名前空間部分を連結するだけです。
std::string buildNamespaceFromSymbolPath(const std::vector<std::string>& symbolPathParts)
{
if(symbolPathParts.size() >= 2)
{
std::ostringstream oss;
bool firstItem = true;
for(unsigned int i = 0;i < symbolPathParts.size() - 1;++i)
{
if((symbolPathParts[i].find('<') != std::string::npos) ||
(symbolPathParts[i].find('(') != std::string::npos))
{
break;
}
if(!firstItem)
{
oss << "::";
}
else
{
firstItem = false;
}
oss << symbolPathParts[i];
}
return oss.str();
}
return "";
}
少なくとも、isClass()
メソッドは正規表現を使用して、コンストラクター メソッドのすべてのシンボルをスキャンします (残念ながら、メンバー関数のみを含むクラスでは機能しないようです)。
std::set<std::string> allClasses;
bool isClass(const std::string& classSymbol)
{
std::set<std::string>::iterator foundClass = allClasses.find(classSymbol);
if(foundClass != allClasses.end())
{
return true;
}
std::string strippedPart;
std::string constructorName = stripBracketPair('<','>',classSymbol,strippedPart);
std::vector<std::string> constructorPathParts;
boost::split(constructorPathParts,constructorName,boost::is_any_of("::"),boost::token_compress_on);
if(constructorPathParts.size() > 1)
{
constructorName = constructorPathParts.back();
}
boost::replace_all(constructorName,"(","[\\(]");
boost::replace_all(constructorName,")","[\\)]");
boost::replace_all(constructorName,"*","[\\*]");
std::ostringstream constructorPattern;
std::string symbolPattern = classSymbol;
boost::replace_all(symbolPattern,"(","[\\(]");
boost::replace_all(symbolPattern,")","[\\)]");
boost::replace_all(symbolPattern,"*","[\\*]");
constructorPattern << "^" << symbolPattern << "::" << constructorName << "[\\(].+$";
boost::regex reConstructor(constructorPattern.str());
for(std::vector<NmRecord>::iterator it = allRecords.begin();
it != allRecords.end();
++it)
{
if(boost::regex_match(it->symbolName,reConstructor))
{
allClasses.insert(classSymbol);
return true;
}
}
return false;
}
前述のように、クラスがコンストラクターを提供しない場合、最後のメソッドは安全にクラス名を見つけられず、大きなシンボル テーブルでは非常に遅くなります。しかし、少なくともこれは nm のシンボル情報から得られるものをカバーしているようです。
他のユーザーが正規表現が正しいアプローチではないことに気付くかもしれないという質問のために、正規表現タグを残しました。